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Zusammenfassung 


In dieser Arbeit geht es um die Frage, wie Leser:innen in Deutschland auto- 
matisiert generierte Nachrichten wahrnehmen und welche Bedeutung sie den 
Verfahren im Journalismus zuschreiben. Im Mittelpunkt steht die Frage, ob das 
Publikum dem automatisierten Journalismus vertraut und welche Einflussfakto- 
ren bei dieser Entscheidung eine Rolle spielen. Ein Mindestmaß an Vertrauen 
der Bevölkerung in Journalismus ist wichtig für die Stabilität demokratischer 
Gesellschaften. In der Forschung ist bisher wenig thematisiert, ob Medieninno- 
vationen wie die automatisierte Berichterstattung Einfluss auf das generalisierte 
Vertrauen der Lesenden haben. Zudem gibt es wenig Wissen über den Umgang 
mit dem, sowie über die Wahrnehmung und die Bewertung des automatisierten 
Journalismus durch verschiedene Publika. 

Basierend auf der Operationalisierung verschiedener Vertrauensbeziehungen 
und der Aufarbeitung des Forschungsstands zur bewerteten Glaubwürdigkeit 
computergenerierter Nachrichtentexte wurde ein Modell entwickelt, das mögliche 
Einflussfaktoren auf die Vertrauensbewertung des automatisierten Journalismus 
darstellt sowie Raum für die Exploration weiterer Faktoren lässt. Zur empiri- 
schen Überprüfung wurden Focus Groups mit gezielt rekrutierten Leser:innen 
eingesetzt: Neben einer heterogen gemischten Focus Group haben einmal Per- 
sonen mit hoher Technikaffinität und Vorwissen zu Verfahren der Künstlichen 
Intelligenz sowie einmal Personen mit hoher Medienkompetenz teilgenommen. 

Die Studienergebnisse zeigen, dass es keine monokausalen Antworten auf die 
Frage nach dem Vertrauen der Lesenden in automatisierten Journalismus gibt. 
Grundsätzlich stehen sie dem Technologieeinsatz neutral und gleichzeitig neu- 
gierig sowie — vor allem mit Blick auf die Zukunft — skeptisch gegenüber. Die 
Teilnehmenden fordern einen transparenten Umgang der Medienorganisationen 


VII 


VIII Zusammenfassung 


mit automatisierter Berichterstattung und wollen mehr Informationen zum Ein- 
satz, zur Verbreitung und zur Technologie haben. Als Einflussfaktoren auf die 
Vertrauensbewertung wurden ausgewählte Personen- sowie Text- und Publika- 
tionsmerkmale und Eigenschaften des Untersuchungsgegenstands getestet. Hohe 
Relevanz haben erkennbar die Angst vor gezielter Manipulation, die individuellen 
Vorstellungen über Künstliche Intelligenzen sowie die Kontingenz von Texten. 

Die Bedeutung dieser Studie besteht darin, dass sie das theoretische Ver- 
ständnis von Vertrauen in Journalismus erweitert sowie die Wahrnehmung des 
automatisierten Journalismus vertieft. Außerdem wird das empirische Verständ- 
nis der Bewertung und Einordnung des Publikums der automatisiert generierten 
Berichterstattung durch die Studienergebnisse exploriert. 
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Einleitung 


„Wir wollen keine Menschen durch Maschinen ersetzen, aber wir wollen Menschen 
durch Maschinen stärker machen“ (Meedia 2022). So formulierte BDZV-Präsident 
Mathias Döpfner auf dem BDZV-Digitalkongress 2022 die Chancen, die er in der 
automatisierten Texterstellung für die Zukunft des Journalismus sieht. Döpfner stellt 
damit die technologische Neuerung des automatisierten Journalismus und die Rele- 
vanz dieser Innovation für Medienorganisationen in den Mittelpunkt. Die Medien- 
unternehmen in Deutschland fordert er auf, verstärkt innovative Technologien und 
automatisierte Inhalteerstellung zu nutzen. Die Relevanz der automatisierten Inhal- 
teerstellung wird auch in der Kommunikationswissenschaft deutlich formuliert: „au- 
tomated journalism has arrived in newsrooms and is likely here to stay“ (Graefe 
2017: 5). 

Mit automatisiertem Journalismus! wird die regelmäßige und kontinuierliche 
„Generierung journalistischer Inhalte aus strukturierten Daten durch Algorithmen“ 
(Haim und Graefe 2018a: 192) beschrieben. Automatisiert generierte Nachrichten- 
texte werden in den USA seit 2010 in der Sportberichterstattung eingesetzt. Auch 
im deutschen Journalismus ist die automatisierte Berichterstattung fest integriert, 
wenngleich nur wenig konkrete Einsatzbeispiele bekannt sind und die Texte selten 
gekennzeichnet werden. Zur Anwendung kommen die Verfahren bei Routinetexten 


! Automatisierter Journalismus wird teilweise auch als Roboterjournalismus bezeichnet. Die- 
ser Begriff wird im empirischen Teil dieser Arbeit verwendet, um Lesenden einen Zugang 
zum Thema zu ermöglichen. Für die wissenschaftliche Auseinandersetzung ist der Begriff zu 
ungenau (Jia 2020: 2613; Graßl et al. 2022: 11f.), deshalb wird im Folgenden nur von automa- 
tisiertem Journalismus, automatisierter Berichterstattung beziehungsweise von automatisiert 
generierten oder computergenerierten Nachrichtentexten gesprochen. 


© Der/die Autor(en) 2024 1 
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2 1 Einleitung 


und datenlastiger Berichterstattung, wie beispielsweise Wetter-, Verkehr-, Finanz- 
aber auch Wahlberichten. Die Neuerung zur bis dato erfolgten Nachrichtenproduk- 
tion ist, dass theoretisch jeder Schritt der Nachrichtenproduktion und -distribution 
ohne weitere journalistische Hilfe algorithmisiert erzeugt werden kann. Das heißt: 
Die Softwaresysteme benötigen — abgesehen von der Installation, dem Training 
sowie der Datenpflege — keine weitere Interaktion von Journalist:innen. Die vor- 
liegende Arbeit konzentriert sich auf die automatisierte Textgenerierung, wobei in 
der Praxis auch weitere Inhalte wie Videos oder Radiobeiträge durch Algorithmen 
erzeugt werden können. Die Vorteile für Medienunternehmen sind vor allem die 
Schnelligkeit der Nachrichtenerstellung sowie die Möglichkeit, kostengünstig eine 
große Anzahl an Nachrichten zu produzieren (vgl. ausführlich Kapitel 3). 

Grundsätzlich sind Veränderungen und der Einsatz technologischer Neuerungen 
im Journalismus keine neuen Phänomene, entscheidend ist die veränderte Rolle der 
Journalist:innen im automatisierten Journalismus: Bei der Verarbeitung von Sprache 
kann die Technik „[ilm Rahmen der menschlich erzeugten Regelwerke [...] auto- 
nom entscheiden“ (Dörr 2016a: 251). Damit wird eine als Kernfunktion anerkannte 
Fähigkeit von Journalist:innen durch Algorithmen umgesetzt: das Strukturieren und 
Verfassen eines Texts gilt als kreative Leistung, die von einem breiten Publikum bis 
vor Kurzem nicht durch „Roboter“, „Maschinen“ oder „künstliche Intelligenzen“? 
substituierbar erschien (vgl. Lewis et al. 2019). 

Das Interesse dieser Arbeit gilt der Wahrnehmung und Vertrauensbewertung 
durch Lesende und nicht der Kommunikatorperspektive, wie sie beispielsweise 
Thurman, Dörr et al. (2017), Siren-Heikel et al. (2019), Kunert (2019) und Danzon- 
Chambaud und Cornia (2021) untersucht haben (vgl. ausführlich Abschnitt 3.2.2). 
Die Beziehung zwischen automatisiertem Journalismus und dem Publikum ist keine 
klassische Mensch-Maschine-Interaktion, wie sie häufig Thema in der Innovations- 
und Transformationsforschung ist. Die Lesenden kommen in Kontakt mit dem Out- 
put und den Ergebnissen der Verfahren, interagieren aber nicht direkt mit den Soft- 
waresystemen. Deshalb könnte argumentiert werden, dass damit die Forschungsre- 
levanz für die Perspektive der Lesenden auf automatisierten Journalismus entfällt, 
da es für das Publikum irrelevant sei, welche Werkzeuge oder Softwaresysteme 
Redaktionen oder Journalist:innen für die Herstellung journalistischer Produkte 
verwenden. Die vorliegende Arbeit zeigt, dass diese Argumentation zu kurz greift: 
Journalistische Medien sind kein klassisches Wirtschaftsgut und ein hinreichend 


2? Hier muss diskutiert werden, ob eine Maschine oder eine Künstliche Intelligenz gleich 
welcher Art, jemals etwas entscheiden, bewerten oder eigenständig handeln kann. Dies wird 
in der Arbeit kontextualisiert; an dieser Stelle soll die Prämisse gelten, dass das Publikum (in 
Teilen) annimmt, eine autonome Entscheidung der Softwaresysteme sei möglich und unter 
dieser Annahme Vertrauen zugesteht oder kein Vertrauen ausspricht. 


1.1. Ziel der Arbeit mit Forschungsstand und Forschungslücken 3 


großes Maß an Vertrauen der Lesenden in Journalismus ist wichtig für die Stabili- 
tät von Demokratien. Zur Beurteilung der Vertrauenswürdigkeit von Journalismus 
ist es für Lesende relevant, zumindest in Grundzügen einschätzen zu können, wie 
Nachrichten entstehen. Dazu wird mittel- und langfristig auch ein grundlegendes 
Verständnis von und Informationen über automatisierte Inhalteerstellung erforder- 
lich und die Wahrnehmung des automatisierten Journalismus durch die Lesenden 
muss in der kommunikationswissenschaftlichen Forschung berücksichtigt werden. 

Für große mediale Aufmerksamkeit hat im November 2022 die Veröffentlichung 
von ChatGPT-3 des US-Unternehmens OpenAl gesorgt. ChatGPT-3 ist ein Chatbot, 
der auf dem Generative Pretrained Transformer 3-Modell (kurz: GPT-3) basiert und 
Nutzer:innen frei zugänglich natürlichsprachliche Kommunikation mit einem KI- 
Chatbot ermöglichen soll. OpenAl hat - für ein eingeschränktes Publikum - bereits 
zuvor die GPT-2 und GPT-3-Modelle veröffentlicht, die für die Erstellung längerer 
Textbeiträge optimiert sind. Im Rahmen dieser Arbeit wird die Verwendung von 
ChatGPT-3 nicht als Teil des automatisierten Journalismus in Deutschland aufge- 
fasst, da bisher (Stand: Februar 2023) keine routinierte Erstellung informierender 
Nachrichtentexte erfolgt (vgl. Loosen und Solbach 2020: 187)°. Die Datenerhebung 
im empirischen Teil dieser Studie erfolgt im Sommer 2022 vor Veröffentlichung von 
ChatGPT-3. Der Einfluss der Rezeption von KI-Darstellungen in den Medien und 
die Vorstellungen über Künstliche Intelligenzen auf die Vertrauensbewertung des 
automatisierten Journalismus wurden in der Erhebung berücksichtigt (vgl. ausführ- 
lich Kapitel 8). Die weitere Entwicklung der Technologie sowie der Umgang der 
Lesenden mit dem Einsatz von selbstlernenden KI-Modellen zur Erstellung von 
Textbeiträgen im Journalismus ist in Folgestudien zu untersuchen (vgl. ausführlich 
Kapitel 9). 


1.1 Ziel der Arbeit mit Forschungsstand und 
Forschungslücken 


Im Mittelpunkt der Arbeit steht die Wahrnehmung des automatisierten Journalismus 
durch deutsche Leser:innen in Bezug zu den Theorien der Kommunikationswissen- 
schaft zu ‚Vertrauen in Journalismus‘. In welchem Umfang automatisiert generierte 
Nachrichtenberichterstattung künftig eine Rolle spielen wird, hängt maßgeblich 
von der Wahrnehmung und dem Vertrauen der Rezipient:innen in die Verfahren und 


3In Kapitel 3 wird ausführlicher beschrieben, dass ChatGPT-3 zum aktuellen Stand von Jour- 
nalist:innen entweder gezielt nur für einzelne Artikel oder Textteile oder als Experiment für 
eine regelmäßig erscheinende KI-Kolumne verwendet wird (vgl. Begriffsdefinition, Darstel- 
lung der Technologie und Anwendungsbeispiele in Kapitel 3). 
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den Output der Technologie ab. Mit der Arbeit wird eine Verbindung geschaffen 
zwischen den im Wesentlichen praxisgetriebenen Erkenntnissen zur automatisier- 
ten Berichterstattung, den Forschungsergebnissen zur bewerteten Glaubwürdigkeit 
computergenerierter Nachrichten durch Lesende sowie den Theorien und Model- 
len der Kommunikationswissenschaft zu Vertrauen in Journalismus. Damit werden 
unter anderem die kommunikationswissenschaftliche Forschung zu Medienwandel 
und Medieninnovationen sowie die Vertrauensforschung weiterentwickelt. Ziel der 
vorliegenden Arbeit ist die Exploration der Vertrauensbewertungen der Lesenden 
hinsichtlich des automatisierten Journalismus beziehungsweise bezogen auf Jour- 
nalismus als Ganzes, der teilweise mit Automatisierungen arbeitet. Die forschungs- 
leitenden Fragen lauten: 


Wie nehmen Lesende automatisierten Journalismus in Deutschland im Jahr 2022 
wahr? Welche Bedeutung haben automatisiert generierte Nachrichtentexte für die 
Bewertung des generalisierten Vertrauens in Journalismus? Welche Bedeutung messen 
Lesende den Verfahren bei und welche Einflussfaktoren wirken auf die Vertrauensbe- 
wertung? 


Als Grundlage dieser Forschungsfragen dienen die Erkenntnisse zur Wahrnehmung 
und der bewerteten Glaubwürdigkeit computergenerierter Nachrichtentexte sowie 
insbesondere die Forschungsmodelle und Operationalisierungen von Medien- und 
Journalismusvertrauen. Damit sind zwei Forschungsbereiche relevant, zu denen die 
Kommunikationswissenschaft - in unterschiedlichem Ausmaß — Forschungsergeb- 
nisse generiert hat. Beide Bereiche wurden aber noch nicht miteinander verbunden. 

Zur Wahrnehmung computergenerierter Nachrichtentexte wurden 15 Rezepti- 
onsstudien* veröffentlicht, die in Online-Experimenten mit anschließenden Befra- 
gungen die Glaubwürdigkeit automatisiert generierter Nachrichtentexte untersucht 
haben. In der Regel wurde die Glaubwürdigkeit als bewertete Qualität, Lesbarkeit 
und in den Texten erkennbare Fachkenntnis operationalisiert. Die Studienergeb- 
nisse zeigen, dass Lesende nicht unterscheiden können, ob die Stimulitexte von 
Journalist:innen oder Algorithmen erstellt wurden. Die Unterschiede in der Glaub- 
würdigkeit und den gemessenen Subdimensionen sind gering und nur in Einzelfällen 
statistisch relevant (vgl. ausführlich in Kapitel 5). Die Rezeptionsstudien bieten aber 
einen breiten Fundus an möglichen Einflussfaktoren für die Vertrauensbewertung 
des automatisierten Journalismus. In einzelnen Arbeiten wurde Vertrauen bereits als 


4 Die Literaturanalyse in Kapitel 5 umfasst: Clerwall (vgl. 2014), Van der Kaa und Krahmer 
(2014), Jung et al. (2017), Haim und Graefe (2017), Graefe, Haim et al. (2018), Wölker und 
Powell (2018), Waddell (2018), Zheng et al. (2018), Liu und Wei (2019), Melin et al. (2018), 
Wus (2020), Waddell (2019), Jia (2020), Tandoc Jr. et al. (2020) und Haim und Graefe (2018a). 
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ein Indikator der Glaubwürdigkeit erhoben, ansonsten wurde Vertrauen nicht weiter 
thematisiert. In dieser Arbeit wird dargelegt, dass Vertrauen und Glaubwürdigkeit 
sowohl theoretisch als auch empirisch eng miteinander verbundene Konzepte sind 
und für das vorliegende Forschungsinteresse das Vertrauen der Lesenden im Mit- 
telpunkt steht (vgl. ausführlich in Kapitel 4). 

Im Umgang mit dem Untersuchungsgegenstand ist das Vertrauen der Lesenden in 
zwei Punkten entscheidend: Zum einen ist Vertrauen in algorithmische Systeme und 
neue Technologien relevant, wenn wichtige Bereiche einer Gesellschaft automati- 
siert werden (vgl. Kraus 2020: XTV). Zum anderen wird Medienvertrauen eine große 
Bedeutung für das Funktionieren freiheitlich-demokratischer Gesellschaften zuge- 
schrieben (vgl. Fawzi, Steindl et al. 2021: 1; Strömbäck et al. 2020: 139; Prochazka 
2020: 1f., 11; Obermaier 2020: 3; van Dalen 2019: 356; Kohring 2004: 11 f.). In einer 
Demokratie ist ein grundlegendes Vertrauen der Mehrheit der Bevölkerung in Jour- 
nalismus die notwendige Voraussetzung dafür, dass dieser seine Kritik-, Kontroll- 
und Informationsfunktion erfüllen kann (vgl. van Dalen 2019: 356). Die Legitimität 
des journalistischen Systems basiert unter anderem auf einem angemessenen Ver- 
trauensniveau der Bevölkerung in das journalistische Angebot, seine Strukturen und 
Akteur:innen. Damit ist vor allem ein mittleres Maß an Vertrauen in Journalismus 
gemeint, so sind kritisches Hinterfragen, eine gewisse Distanz und angemessene 
Skepsis des Publikums gegenüber Medieninstitutionen, Akteuren und Medienin- 
halten wünschenswert (vgl. Prochazka 2020: 107; Steindl 2021: 320)°. 

Vertrauen in Journalismus beziehungsweise Medienvertrauen wird in dieser 
Arbeit verstanden als die Bereitschaft eines Individuums, sich gegenüber Medien 
einem Risiko auszusetzen und auf Basis der in den Medien publizierten Informa- 
tionen, Entscheidungen zu treffen. Dabei vertrauen Lesende entweder darauf, dass 
Medien ihre Aufgaben zufriedenstellend erbringen und/oder sie vertrauen darauf, 
dass Journalismus als Ganzes seine Funktion — gemäß der in der Gesellschaft vor- 
herrschenden Normen und den Werten, deren Einhaltung man von Journalist:innen 
erwartet, erfüllt (vgl. Prochazka 2020: 33, 41 ff., Hanitzsch et al. 2018: 3; Fawzi, 
Steindl et al. 2021: 3). Aus empirischen Studien ist zudem bekannt, dass Lesende in 
Deutschland den Medien und Journalismus im Allgemeinen auf einem vergleichs- 
weise hohen und - in den vergangenen Jahren — stabilem Niveau vertrauen. Verän- 
derungen in der Vertrauensbewertung sind vor allem durch eine stärker werdende 
Polarisierung des Meinungsspektrums zu beobachten, so steigt die Anzahl der Men- 
schen, die besonders hohes oder extrem niedriges Vertrauen angeben. Im interna- 
tionalen Vergleich liegen die Werte der Bundesrepublik im oberen Mittelfeld (vgl. 
ausführlich in Kapitel 4). 


5 Die Aufarbeitung der Vertrauensforschung erfolgt ausführlich in Kapitel 4. 
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In beiden Themenbereichen — in der Wahrnehmung automatisiert generierter 
Nachrichten und in der Vertrauensforschung - gibt es Forschungslücken, die diese 
Arbeit herausarbeiten kann. Zusätzlich gibt es Defizite in der Modellentwicklung, 
die aufgrund des Querschnittsdesigns nur eingeschränkt bearbeitet werden können 
(vgl. ausführlich Kapitel 6). Zunächst fehlen im Forschungsstand zur Wahrneh- 
mung computergenerierter Nachrichtentexte Studien, die weitere Einflussfaktoren 
auf die Bewertung der Texte durch Lesende erheben. Die relevanten 15 Studien 
nutzen alle ein quantitatives Setting, daher fehlt weiterhin ein qualitativer Zugang 
zur Perspektive des Publikums, der auch die Hintergründe, Abwägungen und einen 
offenen und explorativen Zugang zur Wahrnehmung berücksichtigt. Die Wahrneh- 
mung der Lesenden im automatisierten Journalismus ist bislang mit der bewerteten 
Glaubwürdigkeit der Stimulitexte operationalisiert worden, es gibt keine Studien, 
die Vertrauen — als weiterführenden und für die Reflexion geeigneteren Begriff — 
verwenden. Als weiteres Forschungsdefizit fehlen auch in der kommunikations- 
wissenschaftlichen Vertrauensforschung Studien, die zusätzliche Einflussfaktoren 
auf die Vertrauenszuschreibung der Lesenden in journalistische Medien — und ins- 
besondere in ein generalisiertes Vertrauensobjekt — generieren. Es gibt überdies 
wenig Forschung zu Vertrauensbewertungen von Personen, die ein mittleres Ver- 
trauen in deutschen Journalismus angeben. Bisher wurden vor allem medienskepti- 
sche Personen befragt und die Verbreitung von Medienskepsis erforscht. Die Ver- 
trauensforschung arbeitet zudem bisher nicht mit dem Vertrauen der Lesenden im 
Zusammenhang mit Medieninnovations- oder Medienwandelprozessen. In der Wei- 
terentwicklung kommunikationswissenschaftlicher Forschung gibt es außerdem zu 
wenig Forschung zur Stabilität von Vertrauensurteilen. Bekannt ist weiterhin, dass 
das gemessene Vertrauensniveau auch von der Art der Erhebung von Vertrauen 
abhängig ist (vgl. Prochazka 2020: 235). Deshalb sind zusätzliche Arbeiten nötig, 
um die bisherigen Studienergebnisse zu verifizieren. Ausführlich werden die For- 
schungslücken nach der Aufarbeitung der theoretischen Grundlagen dieser Arbeit 
in Kapitel 6 dargestellt. 


1.2 Struktur der Arbeit 


Zur Beantwortung der Forschungsfragen werden drei leitfadengestützte Online- 
Focus Groups durchgeführt. Mit dem qualitativen Setting soll insbesondere eine 
intensive Reflexion der Teilnehmenden zum automatisierten Journalismus erreicht 
werden. Bei den Teilnehmenden werden ein sehr unterschiedliches Vorwissen zum 
automatisierten Journalismus sowie eine große Varianz an Technologieaufgeschlos- 
senheit und Medienkompetenz erwartet. Die Focus Groups werden wie folgt rekru- 
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tiert und realisiert: eine möglichst heterogene Zusammensetzung in Focus Group 
Eins, sowie eine Gruppe mit hoch technologieaffinen und eine Gruppe mit hoch 
medienkompetenten Personen. Ziel dieser Vorgehensweise ist es, eine anregende 
und aktivierende Gesprächsatmosphäre zu schaffen, die Personen mit unterschied- 
lichem Vorwissen möglichst gleichermaßen aktiviert und stille Teilnehmende im 
Blick behält (vgl. ausführlich Kapitel 7). Zusätzlich werden im Sampling der kul- 
turelle Hintergrund der Teilnehmenden, ihr Vertrauen in Journalismus sowie ein 
vorhandener journalistischer Hintergrund kontrolliert. Weiterhin werden demogra- 
fische Merkmale, die Informationsnutzung, Technologieaufgeschlossenheit und das 
individuelle Vorwissen zum automatisierten Journalismus erhoben (vgl. ausführlich 
Abschnitt 7.3). 

Um das Forschungsvorhaben umzusetzen, gliedert sich die Arbeit in folgende 
Abschnitte: Im Anschluss an die Einleitung steht in Kapitel 3 die Definition und 
Beschreibung des ‚automatisierten Journalismus‘ im Mittelpunkt. Dazu wird der 
Untersuchungsgegenstand als aktuelle Entwicklung im Computational Journalis- 
mus und als eine von mehreren Innovationen innerhalb der ‘automated news’ 
beschrieben. Außerdem wird begründet, warum automatisierte Textgenerierung als 
Medieninnovation im größeren Zusammenhang des Medienwandels ‚Automatisie- 
rung‘ einzuordnen ist. Zudem werden zwei Praxisbeispiele für automatisiert gene- 
rierte Berichterstattung vorgestellt, Chancen und Grenzen des automatisierten Jour- 
nalismus beschrieben sowie gesellschaftliche und ethische Diskussionen rund um 
den Einsatz der automatisierten Berichterstattung angesprochen. 

Vertrauen ist — neben dem automatisierten Journalismus — der zweite wesentli- 
che Begriff dieser Arbeit und wird in Kapitel 4 thematisiert. Das Kapitel soll die 
Vertrauensforschung der Kommunikationswissenschaft aufarbeiten und die zentra- 
len Punkte aus der Theorie für das Forschungsanliegen herausstellen. Dazu wird 
zunächst dargelegt, warum Vertrauen der zentrale Begriff dieser Arbeit ist und 
nicht das Glaubwürdigkeitskonzept aus dem Forschungsstand weitergeführt wird. 
Danach werden die Grundlagen des Vertrauensbegriffs, wesentliche Definitionen, 
die Operationalisierung verschiedener Medienvertrauensbeziehungen sowie bisher 
ermittelte Einflussfaktoren für Medienvertrauen angesprochen. Das Kapitel endet 
mit der Aufbereitung empirischer Daten zum aktuellen Stand des Journalismusver- 
trauens in Deutschland. 

In Kapitel 5 wird der Forschungsstand zur Wahrnehmung computergenerier- 
ter Nachrichtentexte durch Lesende besprochen. Dazu wurden weltweit 15 rele- 
vante Studien publiziert, welche die bewertete Glaubwürdigkeit der Stimulitexte 
in Online-Experimenten mit anschließender Online-Befragung erhoben haben. In 
dieser Arbeit werden diese systematisch aufgearbeitet. Neben der Darstellung der 
Studienergebnisse geht es bei der Aufarbeitung des Forschungsstands vor allem um 
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die Analyse der Studienkonzeptionen: Zwar ähneln sich die Arbeiten in ihrem Auf- 
bau grundsätzlich, dennoch sind Unterschiede in den Settings, Schwerpunkten und 
der jeweiligen Operationalisierung zu beobachten. Insbesondere diese Unterschiede 
sind für die vorliegende Arbeitrelevant, da sie als Ideensammlung für mögliche Ein- 
flussfaktoren auf die Wahrnehmung und Vertrauensbewertung des automatisierten 
Journalismus dienen. Diese Ideen werden am Ende des Kapitels aufgeführt. 

Auf dieser Grundlage werden in Kapitel 6 die identifizierten Forschungslücken 
zusammengefasst, das Forschungsmodell der vorliegenden Arbeit präsentiert sowie 
die Forschungs- und Detailfragen abgeleitet und konkretisiert. Zur intersubjektiven 
Überprüfbarkeit der Studie und ihrer Ergebnisse wird die gewählte Methode der 
Focus Groups in Kapitel 7 dargestellt. Dazu erfolgen zunächst die Begründung der 
Methodenwahl für das Anliegen dieser Arbeit, die Darstellung und Rekrutierung der 
Focus Groups sowie die Begründung der Kriterienauswahl. Anschließend wird die 
Vorbereitung, Durchführung und Auswertung der Erhebungsmethode dokumentiert. 

Die Präsentation der Ergebnisse in Kapitel 8 orientiert sich am Prinzip der leitfa- 
dengestützen Focus Groups, die gleichermaßen Offenheit und Zielstrebigkeit hin- 
sichtlich des Erkenntnisinteresses vereinen. Hier werden die Zusammensetzung der 
drei Focus Groups präsentiert und zur Einordnung der Teilnehmenden Fallporträts 
zu jeder Gruppe erstellt. Anschließend geht es um das Verständnis der Teilnehmen- 
den zu interpersonalem Vertrauen und Vertrauen in Journalismus. Danach wird die 
Wahrnehmung des automatisierten Journalismus thematisiert und dazu die Beschrei- 
bung des Untersuchungsgegenstands und die Bewertung durch die Teilnehmenden 
aufgeführt. Weiterhin werden die Erwartungen der Teilnehmenden sowie konkrete 
Forderungen zum Einsatz der Technologie angesprochen. Anschließend erfolgt die 
Ergebnispräsentation zum wahrgenommenen Vertrauen in automatisierten Journa- 
lismus, die Aufarbeitung der analysierten Merkmale sowie die Exploration weiterer 
Einflussfaktoren. 

In Kapitel 9 werden die Studienergebnisse zusammengefasst und die Forschungs- 
fragen beantwortet. Zudem werden die Ergebnisse eingeordnet und einer kritischen 
Reflexion hinsichtlich der Limitationen der Arbeit unterzogen. Abschließend erfol- 
gen ein Ausblick zur weiteren Forschung und die Darstellung konkreter Handlungs- 
empfehlungen für Medienorganisationen, Journalist:innen und die Zivilgesellschaft. 
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Grundlegende Begriffe: Journalismus und 2 
seine Publika 


Die zentralen Begriffe dieser Arbeit sind automatisierter Journalismus und Ver- 
trauen. Beide werden in Kapitel 3 beziehungsweise in Kapitel 4 ausführlich bespro- 
chen. Um das Forschungsvorhaben umsetzen zu können und eine fundierte Doku- 
mentation der Studienergebnisse zu leisten, ist die Definition weiterer grundlegender 
Begriffe notwendig, die im Folgenden kurz skizziert werden. Ziel der Ausführungen 
ist es, eine Arbeitsgrundlage für die Operationalisierung der Begriffe zu schaffen 
und weniger die Kontroversen im Fach zur jeweiligen Begriffsbestimmung — zum 
Beispiel zur Definition von Journalismus — in Gänze nachzuvollziehen. 


Journalismus: Definition, Aufgaben und Funktionen 

Diese Arbeit bezieht sich auf einen Journalismusbegriff, wie ihn beispielsweise 
Prochazka (2020) und Haim (2019) aus der bestehenden Forschung und der Gegen- 
überstellung von akteurszentrierten und systemtheoretischen Perspektiven ablei- 
ten (vgl. Haim 2019: 10-13; Prochazka 2020: 7-12). Journalismus ist „ein Teil 
von Öffentlichkeit, der die zentralen Vermittlungs- und Informationsleistungen in 
demokratischen Gesellschaften erbringt“ (Prochazka 2020: 7) und kann in drei — 
nicht immer eindeutig abgrenzbaren — Ebenen differenziert und für die empirische 
Forschung zugänglich gemacht werden. Relevant sind die individuelle Ebene der 
journalistischen Akteur:innen (Mikroebene), die organisatorische Ebene, zu der bei- 
spielsweise Redaktionen und Medienorganisationen zählen (Mesoebene), sowie die 
gesellschaftliche Ebene, in der Journalismus als eines von mehreren Teilsystemen 
einer Gesellschaft verstanden wird (Makroebene) (vgl. Neuberger 2004; Haim 2019: 
13; Prochazka 2020: 7). Journalistische Akteur:innen agieren in unterschiedlichen 
Rollen auf der individuellen Ebene und erzeugen Medienprodukte, die journalisti- 
sche Aussagen enthalten. Auf der organisatorischen Ebene werden diese Aussagen 
nach „professionellem Maßstab und unter Berücksichtigung spezifischer Regeln 
und Normen innerhalb von Medienorganisationsstrukturen“ (Donges 2006: 564 zit. 
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n. Haim 2019: 13) erzeugt. Journalistische Aussagen entstehen, indem Journalismus 
auf der Makroebene andere relevante Teilsysteme der Gesellschaft, wie etwa Wirt- 
schaft oder Politik, beobachtet und aus dieser Fremdbeobachtung Aussagen gene- 
riert (vgl. Scholl und Weischenberg 1998: 75-78; Luhmann 1996: 173; Kohring 
2004: 164 f.; Neuberger 2004: 14 zit. n. Haim 2019: 13 oder Prochazka 2020: 7 
f.). Die Unterscheidung der drei Ebenen von Journalismus ist für diese Arbeit vor 
allem relevant, wenn es um die Bezugsobjekte von Vertrauen geht und die Frage 
‚Wem oder was wird im automatisierten Journalismus vertraut?‘. Die theoretische 
Abgrenzung verschiedener Vertrauensobjekte erfolgtin Abschnitt 4.3.1, wenngleich 
Prochazka (2020) festhält, dass „Vertrauen in das System Journalismus [...] zwar 
analytisch vom Vertrauen in Medieninstitutionen zu trennen [ist], [...] empirisch 
aber kaum zu unterscheiden sein [wird]“ (ebd.: 43). 

Journalistische Berichterstattung grenzt sich von nicht-journalistischer Bericht- 
erstattung und anderen Formen der Massenkommunikation wie beispielsweise 
Presse- und Öffentlichkeitsarbeit ab, wenn Kriterien wie Aktualität, Relevanz, Peri- 
odizität und Unabhängigkeit der Berichterstattung erfüllt sind (vgl. Scholl und Wei- 
schenberg 1998: 78; Meier 2018: 14, 16f.). Damit ist gemeint, dass Nachrichtenan- 
lässe aktuell und relevant sind, insgesamt regelmäßig und wiederkehrend berichtet 
wird sowie die Berichterstattung nicht von Interessen einzelner Personen oder Insti- 
tutionen bestimmt wird oder davon abhängig ist. Journalistische Aussagen müssen 
sich an der Wirklichkeit orientieren und „mit dem Anspruch auf Wahrheit pro- 
duziert“ (Rager 2000: 82 zit. n. Prochazka 2020: 8) werden. Außerdem werden 
im Journalismus keine fiktiven Ereignisse thematisiert. Journalistische Aussagen 
basieren auf nachprüfbaren Fakten, die von Journalist:innen recherchiert, überprüft 
und belegt werden (vgl. ebd.: 8). In demokratischen Gesellschaften erfüllt Journalis- 
mus mehrere Funktionen, die sich aus demokratietheoretisch-normativen Wertvor- 
stellungen ableiten lassen. Dazu gehören die Thematisierungs- und Informations- 
funktion, die Herstellung eines Forums für gesellschaftlichen Dialog, die Artiku- 
lationsfunktion, die Integrations- und Sozialisationsfunktion sowie die Kritik- und 
Kontrollfunktion (vgl. Pürer 2014: 116f.; Stöber 2008: 128-137; Prochazka 2020: 
9 f.; Haim 2019: 14). Journalismus soll „Transparenz herstellen, staatliche Gewalten 
kontrollieren, als ‚Frühwarnsystem der Gesellschaft‘ die öffentliche Aufmerksam- 
keit auf zentrale Themen lenken, dabei immer vollständig und sachlich informieren 
und eine möglichst umfängliche Vielfalt von Themen, Meinungen und AkteurInnen 
sicherstellen“ (Meier 2007: 15 zit. n. Haim 2019: 14). 

Neben der theoretischen Begriffsbestimmung hat Prochazka (2020) in qualitati- 
ven Leitfadeninterviews Online-Nachrichtennutzer:innen in Deutschland zu ihrem 
Verständnis von Journalismus befragt. In der Empirie konnte der Autor zeigen, dass 
unter den Befragten zwei gegensätzliche Vorstellungen von Journalismus existieren 
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und diese unter anderem durch das Vertrauen der Lesenden in Journalismus beein- 
flusst werden (vgl. ebd.: 134ff.). Die Mehrheit der Befragten geben ein mittleres 
oder hohes Vertrauen an und definiert Journalismus nach formalen Kriterien: „Jour- 
nalismus [ist alles], was hauptberuflich in professionellen Medienhäusern erbracht 
wird“ (ebd.: 134). Dagegen orientieren sich Personen, die als medienskeptisch gel- 
ten, zur Beschreibung an normativen Qualitätsvorstellungen und nicht an formalen 
Kriterien: Journalismus ist nur das, „was auf Grundlage eigener Rechercheleis- 
tung über faktische Ereignisse berichtet [wird] und Informationen ohne persönli- 
che Wertung wiedergibt“ (ebd.: 134). Unabhängig von der jeweiligen Definition, 
was Journalismus ausmacht, haben alle Befragten aber „ähnliche Vorstellung des- 
sen, was journalistische Mainstream-Medien ausmacht und bringen diesen auch 
ein generalisiertes Vertrauen bzw. Misstrauen entgegen“ (ebd.: 158). Diese empiri- 
sche Entsprechung der theoretischen Begriffsbestimmung und der Bezug zu einem 
generalisiertem Vertrauensobjekt wird ausführlich in Kapitel 4 thematisiert. 


Publikum und Lesende 

In dieser Arbeit wird zudem häufig von ‚den Lesenden‘ gesprochen, deshalb soll im 
Folgenden kurz das zugrundeliegende Verständnis von Publikum beziehungsweise 
Publika und Lesenden skizziert werden. Die Kommunikationswissenschaft begreift 
Publika als „disperse Potpourri an EmpfängerInnen massenmedialer Kommunika- 
tion“ (Haim 2019: 47), also eine Zusammensetzung aus diversen und heterogenen 
Gruppen!. Publika sind in „in ihrer Zusammensetzung dynamisch-instabil, viel- 
schichtig, zeitlich wie räumlich heterogen und nicht zuletzt deshalb in ihrer Gänze 
anonym. Das Publikum lässt sich entsprechend weder messbar noch fassbar machen. 
Vielmehr bildet es in der Massenkommunikation qua definitionem ein Konstrukt, 
das in Gänze nicht näher bestimmbar ist [Herv. i. Org.]“ (Hasebrink 2008 zit. n. 
Haim 2019: 47). 

In demokratischen Gesellschaften ist die Beziehung zum Publikum für Jour- 
nalismus auf allen drei besprochenen Ebenen wichtig: Auf der Makroebene stellt 
Journalismus die Möglichkeit der Selbstbeobachtung des Publikums bereit (vgl. 
Neuberger und Nuernbergk 2015: 199). Auf der Mesoebene bedienen Medienor- 
ganisationen verschiedene Publika — hier auch Zielgruppen genannt - (vgl. Hase- 
brink 2008: 521 f.) und auf der Mikroebene sind die Lesenden die „individuellen 
LeistungsempfängerInnen“ (Haim 2019: 47) journalistischer Produkte (vgl. ebd.: 
46f.). Ausführlich beschäftigen sich beispielsweise Haim (2019), Loosen und Dohle 
(2014), Prochazka (2020: 12-17), Altmann (2011) mit der Differenzierung von 


! Dispers stammt vom lateinischen Verb ‚dispergere‘, was so viel wie ausbreiten oder zer- 
streuen bedeutet. 
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Publika sowie den Veränderungen durch Online-Kommunikation und der dadurch 
veränderten Rolle von Rezipierenden im Journalismus. Dabei wird insbesondere 
berücksichtigt, dass Journalismus — im Gegensatz zu regulären Wirtschaftsgütern — 
besondere Eigenschaften besitzt und beispielsweise der öffentlich-rechtliche Rund- 
funk in Deutschland über den Rundfunkbeitrag und nicht durch eine direkte Publi- 
kumsnachfrage finanziert wird (vgl. Haim 2019: 70). 

Bereits in diesem kurzen Überblick wird deutlich, dass es ‚das Publikum‘ nicht 
gibt, sondern differenzierte Publika und verschiedene Gruppierungen des Publikums 
existieren. Journalismus tritt auf verschiedenen Ebenen in Kontakt mit Personen, 
die individuelle Ansichten und Meinungen haben und sich durch unterschiedliche 
Merkmale auszeichnen. Deshalb soll diese Arbeit mit dem Bewusstsein rezipiert 
werden, dass sich die Studie im Spannungsfeld zwischen der für die Operatio- 
nalisierung notwendigen Verallgemeinerung der Lesenden und gleichzeitig einer 
Einschränkung der Generalisierbarbeit der Ergebnisse und der Gefahr der Entste- 
hung blinder Flecke bewegt. Im Mittelpunkt dieser Arbeit steht nur ein Ausschnitt 
aller Personen, die in Deutschland journalistische Produkte konsumieren: Rekru- 
tiert werden Personen, die in Deutschland leben und Deutsch auf Muttersprachni- 
veau sprechen sowie mittleres Vertrauen in Journalismus angeben (vgl. ausführlich 
Abschnitt 7.3). Ziel ist die Exploration der Vertrauensbewertung des automatisier- 
ten Journalismus und diese Arbeit berücksichtigt ein disperses Publikum zumindest 
insofern, dass drei Focus Groups mit gezielter Zusammensetzung und unterschied- 
lichen Hintergründen der Teilnehmenden operationalisiert werden und damit — im 
Rahmen des Samples - für verschiedene Zugänge auf den Gegenstand gesorgt wird. 
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Forschungsobjekt: automatisierter 3 
Journalismus 


In Kapitel Drei wird das Untersuchungsobjekt der vorliegenden Arbeit, der automa- 
tisierte Journalismus, dargestellt. Ziel des Kapitels ist es, in das Forschungsthema 
einzuführen, eine Systematisierung der Praxis vorzulegen sowie Anschluss an die 
bisherigen Forschungsergebnisse zu leisten. Dazu werden zunächst die wesentlichen 
Bestandteile des Begriffs erläutert und der Untersuchungsgegenstand beschrieben. 
Im Anschluss wird der Umgang der Kommunikationswissenschaft mit automati- 
siertem Journalismus und den daraus erzielten Forschungsergebnissen zusammen- 
gefasst. Weiterhin wird die Umsetzung der automatisierten Berichterstattung in der 
Praxis beschrieben. Dazu erfolgt ein Überblick über den ökonomischen Markt, und 
ausgewählte Beispiele aus dem deutschen Journalismus werden dargestellt. Zudem 
wird thematisiert, welche Vor- und Nachteile sowie mögliche Konsequenzen sich mit 
Einsatz des automatisierten Journalismus mittel- und langfristig für Journalist:innen, 
Rezipient:innen, Medienorganisationen und die Gesellschaft ergeben können. 


3.1 Begriffsdefinition und Beschreibung des Gegenstands 


Die wissenschaftliche Auseinandersetzung mit dem Untersuchungsgegenstand 
erfolgt im deutschsprachigen Diskurs unter den Bezeichnungen ‚automatisierter‘ 
(vgl. z. B. Haim und Graefe 2018b) oder ‚algorithmischer Journalismus‘ (vgl. Dörr 
2017), selten unter ‚Roboterjournalismus‘ (vgl. Habel 2019). Auf Englisch wird zu 
‚automated news‘, ‚automated journalism‘ und ‚algorithmic journalism‘ publiziert 


© Der/die Autor(en) 2024 15 
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(vgl. z. B. Diakopoulos 2019; Dörr und Hollnbuchner 2017)!. Automatisierter Jour- 
nalismus ist eine Medieninnovation im ‚Computational Journalism‘ und kann unter 
„automated news‘ subsummiert werden (vgl. zur wissenschaftlichen Auseinander- 
setzung und Einordnung ausführlich Abschnitt 3.2). 

Definiert wird automatisierter Journalismus als „algorithmic processes that con- 
vert data into narrative news with limited to no human intervention beyond the 
initial programming“ (Carlson 2014: 416). Er dient im Journalismus der „effizien- 
ten Abarbeitung von Aufgaben, die einem bestimmten Muster folgen“ (Haim und 
Graefe 2018b: 154). Die Verfahren sind grundsätzlich weder auf eine journalistische 
Darstellungsform noch auf ein bestimmtes Thema beschränkt. Damit die automa- 
tisierte Berichterstattung umgesetzt werden kann müssen in der Regel aber ausrei- 
chend strukturierte Daten sowie ein standardisierter Textaufbau? vorliegen (vgl. zu 
den einzelnen Punkten die ausführlichere Darstellung in den Folgeabschnitten). 

Mit der Veröffentlichung von ChatGPT im November 2022 wurde die auto- 
matisierte Textgenerierung auch einer breiteren Öffentlichkeit zugänglich (vgl. 
Kapitel 1). In diesem Zusammenhang sind eine Reihe von Berichten entstanden, 
bei denen Journalist:innen ChatGPT zur Erstellung einzelner Textteile oder ganzer 
Artikel verwendet haben (vgl. z. B. von Lindern 2022). Diese singuläre Nutzung 
von Textgenerierungsalgorithmen fällt in dieser Arbeit nicht unter die Definition 
des automatisierten Journalismus, da zum Abschluss dieser Studie stets eine enge 
Anbindung der Texte an Journalist:innen gegeben ist, diese in hohem Maße kura- 
tiert werden und die Automatisierung keine Auswirkung auf den journalistischen 
Produktionsprozess insgesamt hat. Die vorliegende Arbeit versteht automatisier- 
ten Journalismus im Folgenden und in Anlehnung an Haim und Graefe (2018b: 
154) daher als regelmäßige und routinierte Erstellung journalistischer Inhalte durch 
Textgenerierungsalgorithmen. Darunter werden sowohl vollständig automatisiert 
generierte Berichte als auch hybrid erzeugte, in direkter Zusammenarbeit aus Algo- 
rithmus und Journalist:in erstelle, Texte gefasst. 

Angewandt wird die automatisierte Berichterstattung vor allem in den Themen- 
bereichen Sport, Wetter, Finanzen, Verkehr und bei der lokalen Wahlberichterstat- 
tung (vgl. Kunert 2019: 140). Es gibt zudem Beispiele aus der Praxis, bei denen auto- 
matisierte Geschäftsberichte, Boulevardnachrichten, Reiseberichte oder Berichte 


! In der Einleitung wurde bereits darauf hingewiesen, dass der teilweise in der Praxis ver- 
wendete Begriff ‚Roboterjournalismus‘ nur im empirischen Teil zur Benennung des Untersu- 
chungsgegenstands, nicht zur Auseinandersetzung mit dem Phänomen geeignet ist (Jia 2020: 
2613; Graßl et al. 2022: 11 f.). 

2 Neben der automatisierten Textgenerierung werden auch einfache Video- oder Radiobeträge 
automatisiert erstellt (vgl. Jia 2020: 2613; Koliska et al. 2021: 1162). Die vorliegende Arbeit 
konzentriert sich auf die Textgenerierung. 
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aus Wahlumfragen generiert wurden (vgl. Dörr 2017: 51; Haim und Graefe 2018b: 
142). Außerdem gibt es Versuche, auf lokaler Ebene zu „road conditions, public 
safety, crime and health“ (Diakopoulos 2019: 108) automatisiert zu berichten. In 
der Regel werden informierende und eher kurze Nachrichtentexte umgesetzt, die 
einer einfachen Struktur folgen und wenig komplex aufgebaut sind. Vereinzelt gibt 
es Projekte, in denen längere Texte automatisiert verfasst werden oder mit wei- 
teren Darstellungsformen experimentiert wird (vgl. Anwendungsbeispiel Anic in 
Abschnitt 3.3.3). 

Umgesetzt wird automatisierter Journalismus mit natürlichsprachlicher Textge- 
nerierung (engl.: Natural Language Generation, NLG). Nach der Installation, der 
Verknüpfung mit entsprechenden Datenbanken und dem Training der Software kön- 
nen automatisiert Nachrichten erzeugt werden, ohne dass eine weitere Interaktion 
durch Journalist:innen erfolgen muss. Der Algorithmus kann dazu den gesamten 
Nachrichtenproduktionsprozess automatisiert durchlaufen und — wenn gewünscht 
— die Texte direkt veröffentlichen. Als Grundlage der NLG-Systeme werden zum 
einen Daten in ausreichender Menge und entsprechender Qualität benötigt. Dazu 
müssen in der Regel strukturierte Daten zur Verfügung stehen’. Zum anderen müs- 
sen die Algorithmen durch ein entsprechendes Training in den redaktionellen Pro- 
zess eingebunden werden (vgl. Haim und Graefe 2018b: 152£.; Diakopoulos 2019: 
121-125). Dazu definieren Journalist:innen unter anderem Regeln zur Nachrich- 
tenauswahl sowie zur Gewichtung und Priorisierung von Ereignissen und legen 
außerdem Details zur Sprachausgabe fest (vgl. dazu auch Abschnitt 3.3.1). 

Neben der Verwendung von Softwaresystemen mit unterschiedlicher Komple- 
xität und Datengrundlage unterscheidet sich in der Praxis außerdem die konkrete 
Umsetzung des automatisierten Journalismus und die Anbindung in die jeweili- 
gen Redaktionen: Es gibt Anwendungsbeispiele, die den vollständigen Nachrich- 
tenproduktionsprozess automatisiert haben und das System — vom Auslösen der 
Produktion bis zur Publikation der Nachricht — ohne weitere menschliche Interak- 
tion ausgeführt wird. Außerdem existieren Anwendungen, bei denen eine Kontrolle 
der automatisiert generierten Texte durch Journalist:innen erfolgt. Die Texte wer- 
den gegebenenfalls leicht verändert und durchlaufen damit vor der Veröffentlichung 
einen Freigabeprozess. In anderen Redaktionen werden die Nachrichtenproduktion 
gezielt als Zusammenspiel zwischen Mensch und Maschine aufgebaut: In der so 
genannten hybriden Form werden automatisiert generierte Texte erzeugt, die dann 


3 Nicht-strukturierte Daten verarbeiten zu können, fällt in das Gebiet des Natural Language 
Processing (kurz: NLP). Auch hier findet Forschung und Weiterentwicklung der bisherigen 
Technologie statt. So können in Zukunft möglicherweise auch verstärkt nicht-strukturierte 
Daten als Grundlage des automatisierten Journalismus genutzt werden, bisher sind aber in 
der Regel strukturierte Daten notwendig. 
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von Journalist:innen beispielsweise um einen O-Ton oder die Beschreibung eines 
Vorort-Ereignisses ergänzt werden (vgl. Diakopoulos 2019: 96 f.; Loosen und Sol- 
bach 2020: 179). Dabei sollen die Vorteile beider Verfahren genutzt werden, die 
Schnelligkeit und Datenverarbeitung der Algorithmen sowie die Fähigkeit der Jour- 
nalist:innen, zum Beispiel zur Recherche von neuen Informationen und der Ein- 
ordnung von Sachverhalten. In der Praxis wird automatisiert generierte Berichter- 
stattung zudem mit weiteren Innovationen innerhalb des Computational Journalism 
kombiniert, im Projekt „Superkühe“ (WDR 2017) beispielsweise mit Sensorjour- 
nalismus (vgl. dazu auch Abschnitt 3.3.2). 

Automatisiert generierte Nachrichten gelten als eher wenig anspruchsvoll in 
der Qualität und hinsichtlich des Lesevergnügens und sind bisher nicht geeignet, 
um Hintergründe zu recherchieren, Abwägungen von Argumenten vorzunehmen 
oder neue Ereignisse zu bewerten. Sie können zudem weder Sinnzusammenhänge 
abbilden noch aktuelle Ereignisse in einen größeren historischen Kontext einordnen 
oder eigenständig eine Verifikation von Ereignissen vornehmen (vgl. Graefe 2017: 
23; Porlezza 2020: 148f.; Jia 2020: 2611; Haim und Graefe 2018b: 139, 153f.; 
Diakopoulos 2019: 116f., 125f.; Kunert 2019: 143). 

Im deutschen Journalismus gibt es keine Regeln und keine Selbstverpflichtung 
zur Kennzeichnung von automatisiert generierten oder hybrid erzeugten journalisti- 
schen Texten*. Weiterhin gibt es auch keine validen Daten über die Verbreitung der 
Verfahren und den Umfang der automatisierten Berichterstattung (vgl. Haim und 
Graefe 2018b: 145). Einige Zeitungen oder Nachrichtendiensten kennzeichnen die 
Texte, z. B. die Stuttgarter Zeitung und die Rheinische Post (vgl. Abschnitt 3.3.3). 
Insgesamt sind automatisiert generierte Nachrichten seit 2007 mit einzelnen Pro- 
jekten und seit 2010 regelmäßig im Journalismus im Einsatz (vgl. dazu ausführlich 
Abschnitt 3.3). 


3.2 Kommunikationswissenschaftliche 
Forschungsperspektiven 


Der folgende Abschnitt fasst den Forschungsstand der Kommunikationswissen- 
schaft zum automatisierten Journalismus zusammen. Dazu erfolgt zunächst eine 
Einordnung des Gegenstands in bestehende Forschungsbereiche (vgl. Abschnitt 
3.2.1). Anschließend werden insbesondere deskriptiv-empirische Arbeiten 


4 Mit der Kennzeichnung automatisiert generierter Texte auf der professionellen Ebene in den 
USA haben sich im Schwerpunkt zudem Montal und Reich (2017, 2019) beschäftigt. 
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thematisiert, die zur Perspektive der Kommunikator:innen und der Rezipient:innen 
im automatisierten Journalismus vorliegen (vgl. Abschnitt 3.2.2). 

Insgesamt zeichnet sich die Forschung zum automatisierten Journalismus durch 
einander überschneidende Begriffe und überlappende Konzepte zu angrenzen- 
den Themen aus, die ähnliche Fragestellungen bearbeiten. So werden Fragen des 
normativ-ethischen Umgangs mit Algorithmen in der Gesellschaft nicht nur zum 
automatisierten Journalismus, sondern auch in weiteren Bereichen des Computatio- 
nal Journalism angesprochen. Das Forschungsgebiet ist zudem stark praxisgetrie- 
ben: Dies betrifft vor allem die Begriffsabgrenzung sowie die fortschreitende tech- 
nologische Entwicklung, die den Umgang der beteiligten Akteur:innen mit dem 
Gegenstand und ihre Wahrnehmung von automatisierter Berichterstattung verän- 
dern. Außerdem überwiegen im Forschungsgebiet deskripiv-empirische Arbeiten. 
Die Anbindung an bestehende Theorien und Modelle der Kommunikationswissen- 
schaft erfolgt nur schrittweise, sodass Haim und Graefe (ebd.) resümieren: „aktu- 
ell verfügbare Arbeiten sind [...] häufig mehr von einer Aufbruchsstimmung denn 
von einer distanzierten Objektivität geprägt“ (ebd.: 140). Einen stärkeren Bezug 
zu kommunikationswissenschaftlichen Modellen und Theorien beziehungsweise 
einen Fokus auf modellentwickelnde Forschung zeigen dagegen neuere Arbeiten 
zur Kommunikatorforschung, die ebenso aufgeführt sind. 


3.2.1 Einordnung in die Kommunikationswissenschaft 


Der automatisierte Journalismus wird in Verbindung mit der kommunikations- 
wissenschaftlichen Forschung dargestellt, um eine Anschlussfähigkeit des Gegen- 
stands an das Fach zu leisten und Forschungsperspektiven aufzuzeigen. Dazu wer- 
den zunächst die Medieninnovations- beziehungsweise Medienwandelforschung 
zusammengefasst sowie der Forschungsbereich des Computational Journalism und 
die Systematisierung des automatisierten Journalismus von Dörr (2017) dargestellt. 


Medienwandel und Medieninnovationsforschung 

Medien und Journalismus sind Branchen, die sich durch Veränderungen, Wandel 
und technologische Innovationen auszeichnen. Dogruel (2012) spricht vom „Zwang 
zur Neuheit“ (ebd.: 100) und der Veränderbarkeit als Unterscheidungsmerkmal von 
Medienprodukten im Vergleich zu anderen Wirtschaftsgütern. Für den automati- 
sierten Journalismus und das vorliegende Erkenntnisinteresse ist relevant, ob der 
Untersuchungsgegenstand eine Veränderung, einen Wandel oder eine Innovation 
darstellt; darüber hinaus wird untersucht, was diese Einordnung für die Forschung 
beziehungsweise die Forschungsrelevanz des Gegenstands bedeutet. Im Folgen- 
den wird dargelegt, dass automatisiert generierte Nachrichten eine Veränderung 
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und eine wesentliche Innovation im Journalismus darstellen, welche im größeren 
Zusammenhang des Medienwandels der fortschreitenden Automatisierung journa- 
listischer Nachrichtenproduktion zu sehen sind. 

Unter ‚Medienwandel‘ werden „nachhaltige]...] Veränderungen der technischen 
Kommunikationskanäle, Organisationen und sozialen Institutionen verstanden, die 
die Kommunikation in einer Gesellschaft ermöglichen und vermitteln und dadurch 
[...] prägen [Herv. i. Org.]“ (P. Müller 2016: 33). Wandel findet nur statt, wenn beste- 
hende „Regelmäßigkeiten der gesellschaftlichen Kommunikation“ (ebd.: 33) dau- 
erhaft verändert werden. Dabei bedeutet „Wandel [...] zwar immer ‚Veränderung‘, 
nicht jede Veränderung ist jedoch ein Wandel“ (Blöbaum 2005: 43). Selbst wenn 
in beiden Definitionen nicht klar abgegrenzt wird, was einen ‚nachhaltigen‘ Wan- 
del ausmacht, wird deutlich, dass automatisierter Journalismus zwar eine Verände- 
rung in der journalistischen Nachrichtenproduktion darstellt, zum Zeitpunkt dieser 
Arbeit mit der computergenerierten Berichterstattung alleine aber kein übergeord- 
neter Medienwandel vorliegt. Zudem betont die Medienwandelforschung, dass bei 
der Analyse von Wandlungsprozessen neben den technologischen Veränderungen 
die gesellschaftlichen Rahmenbedingungen, der Umgang der Nutzer:innen sowie 
Folgen und Wirkungen der Veränderungsprozesse mit berücksichtigt werden müs- 
sen (vgl. P. Müller 2016: 3; Stöber 2013; Dogruel 2013). Dies gilt insbesondere 
auch für die Forschung zum automatisierten Journalismus. 

Medieninnovationen sind zentraler Gegenstand der Forschung zum Medienwan- 
del (vgl. Dogruel 2013: 16) und werden definiert als „bestimmte[] kommunikati- 
onswissenschaftliche[] Materialobjekte, die im Hinblick auf ihre Auswirkungen auf 
das Formalobjekt ‚Kommunikation‘ hin untersucht werden“ (ebd.: 13). Medienin- 
novationen sind mehrdimensionale Objekte und als „Zusammenspiel von Teilin- 
novationen zu verstehen, die durchaus zeitlich asynchron verlaufen können, sich 
jedoch untereinander durchweg bedingen“ (Dogruel 2013 zit. n. Krüger 2021: 76). 
Zur Bestimmung einer Medieninnovation werden drei Indikatoren genannt: Neu- 
heit, Verwertbarkeit im ökonomischen Kontext sowie kommunikative Folgen’ (vgl. 
Dogruel 2013: 302-305; Krüger 2021: 76£.). 

Automatisiert generierte Nachrichten stellen eine Abweichung der bestehen- 
den Nachrichtenproduktion dar und können daher als Neuheit bezeichnet werden. 
Zudem zeigen der Überblick über die Entwicklung des ökonomischen Marktes 
der computergenerierten Berichterstattung in Abschnitt 3.3.2 sowie die Anwen- 
dungsbeispiele in Abschnitt 3.3.3, dass der automatisierte Journalismus in der Wirt- 
schaft Anwendung und ökonomische Verwertung findet. Automatisiert generierte 


5 Mit kommunikativen Folgen sind „Auswirkungen auf (interpersonale, gruppenbezogene, 
öffentliche) Kommunikationsprozesse und -strukturen“ (Dogruel 2013: 304) gemeint. 
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Nachrichten haben überdies kommunikative Folgen in bestimmten Themengebie- 
ten, indem Berichterstattung in Nischenthemen erfolgen kann, in denen eine journa- 
listische Berichterstattung bislang ökonomisch nicht rentabel war. Zusätzlich wird 
angenommen, dass eine zunehmende Personalisierung von Nachrichten durch den 
automatisierten Journalismus mittel- und langfristig weitere Folgen für gesellschaft- 
liche Kommunikationsprozesse haben wird. Dörr (2017) argumentiert ähnlich und 
definiert automatisierten Journalismus als „zentrale Triebkraft im Medienwandel“ 
(ebd.: 54) der Automatisierung oder Algorithmisierung von Journalismus (vgl. auch 
Loosen und Solbach 2020: 179). 


Computational Journalism 

Automatisierter Journalismus wird — vor allem in der englischsprachigen Forschung 
— als Teil des Forschungsgebiets zum Computational Journalism® verortet (zum 
Überblick vgl. Thurman 2020; Thurman, Lewis et al. 2019; Loosen und Sol- 
bach 2020; Dörr 2016a; Diakopoulos und Koliska 2017; Coddington 2019) und 
wird verstanden als „advanced application of computing, algorithms, and automa- 
tion to the gathering, evaluation, composition, presentation, and distribution von 
news“ (Thurman 2020: 180). Im Zentrum steht also die Kombination von Algorith- 
men, Daten und quantitativen Methoden der Sozialwissenschaft, um journalistische 
Akteur:innen im Nachrichtenproduktionsprozess zu unterstützen (vgl. J. T. Hamil- 
ton und Turner 2009). 

Der Forschungsbereich entwickelt sich aus der computergestützten Berichterstat- 
tung (engl.: Computer-Assisted-Reporting, kurz CAR), die seit den 1960er Jahren 
in US-Redaktionen — anfangs vor allem zur Unterstützung von Investigativjour- 
nalist:innen — eingesetzt wird (vgl. Pavlik 2009: 93 ff.). In den Folgejahren wird 
die Verwendung des Computers nach und nach ausgeweitet und es werden weitere 
Methoden zur Sammlung, Auswertung und Aufbereitung von Daten entwickelt. Als 
Entwicklungsschritt beschreibt Pavlik (ebd.) das Aufkommen des Datenjournalis- 
mus: Ab 2005 werden Daten nicht nur im investigativen Bereich, sondern im gesam- 
ten Produktionsprozess gezielt ausgewertet (vgl. ebd.: 96). Thurman (2020) führt 
weiter aus, dass seit den 1980er Jahren Softwareprogramme im Einsatz sind, die die 
Personalisierung von Nachrichten umsetzen (vgl. ebd.: 180,189). Ab 2010 startet 
zudem langsam das computergestützte Schreiben, das seit 2018 fest im redaktio- 
nellen Ablauf etabliert ist (vgl. Thurman 2020: 189; Haim und Graefe 2018b: 146). 
Insgesamt ist der Forschungsbereich des Computational Journalism praxisgetrieben 
und hat sich im Laufe der Zeit deutlich erweitert und entwickelt. Maßgebliche Ent- 
wicklungsschritte sind zu beobachten, als sich die Rechenleistung von Computern 


6 Es gibt keine geläufige deutsche Übersetzung des Computational Journalism. 
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deutlich verbessert oder sich Distributionskanäle — zum Beispiel durch das Internet 
— verändern. Außerdem wird die „Verfügbarkeit brauchbarer Daten [...] aus organi- 
satorischer Perspektive zur relevanten Größe“ (Graefe, Haim et al. 2018: 155) (vgl. 
dazu Herausforderungen in Abschnitt 3.4.2). 

Spätestens seit 2006 ist der Begriff der computergestützten Berichterstattung zur 
Deskription nicht mehr geeignet, da der Einsatz von Computern in den Redaktionen 
über eine unterstützende Funktion hinausgeht (vgl. Thurman 2020: 181 f.). Mit der 
veränderten Perspektive — von der Unterstützung hin zu redaktionellen Entschei- 
dungen, die ein Algorithmus treffen kann — werden im Computational Journalism 
zusätzlich zur Beschreibung der technologischen Entwicklungen und der Umgang 
der beteiligten Akteur:innen verstärkt normativ-ethische Frage, wie z. B. die zur 
Grundlage und Transparenz der Daten (‚algorithmic transparency‘) oder zu Ver- 
antwortungsträger:innen algorithmischer Systemen (‚algorithmic accountability‘) 
bearbeitet (vgl. auch Abschnitt 3.4). Zudem werden Diskussionen um geeignete 
Forschungsmethoden zur Analyse des Computational Journalism wichtiger (vgl. 
ebd.: 189). Diakopoulos und Koliska (2017) beispielsweise schlagen Folgendes 
vor: „[A]lgorithmic power could be analyzed by looking at the decision algorithms 
make, including how they prioritize, classify, associate, and filter information“ (ebd. 
zit. n. Thurman 2020: 189). 


Automatisierter Journalismus in der deutschen Kommunikationswissenschaft 
Ziel der vorliegenden Arbeit ist es, den Einfluss des automatisierten Journalismus 
auf gesellschaftlicher, organisatorischer und professioneller Ebene zu analysieren. 
Dazu leistet Dörr (2017) — Rückbezug auf Modelle der Techniksoziologie, der 
Informations- und Kommunikationstechnologie sowie dem Kontext-Modell von 
Weischenberg (2004) — die erste grundlegende Untersuchung des automatisierten 
Journalismus und die Verortung des Untersuchungsgegenstands in der deutsch- 
sprachigen Kommunikationswissenschaft. Deutlich zeigt Dörr (2017) dabei die 
Relevanz der Forschung zum automatisierten Journalismus und die Veränderun- 
gen im Journalismus durch den Einsatz der Technik, die sich sowohl auf der Ebene 
der Medienaussagen, der Medienakteur:innen sowie der Medieninstitutionen und 
Mediensysteme ergeben. Zugleich entwickelt er ein Analyseschema für weiterfüh- 
rende Forschung sowie die Möglichkeit, die erzielten Forschungsergebnisse in die 
Kommunikationswissenschaft einzubinden. Auf dieser Grundlage legt Dörr (ebd.) 
zudem eine technologische Potentialanalyse vor, die im Abschnitt 3.3.1 behan- 
delt wird und der Veranschaulichung des Prozesses der algorithmischen Selektion 
in der automatisierten Berichterstattung dient. Außerdem verwendet Dörr (2017) 
Arbeiten aus der Techniksoziologie und dem Modell der gradualisierten Hand- 
lungsträgerschaft, um die Perspektive der Kommunikator:innen auf professionel- 
ler Ebene zu explorieren. Diese Arbeit soll weiteren Autor:innen als Basis zur 
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Erweiterung beziehungsweise dem Aufbau kommunikationswissenschaftlicher 
Modell zum automatisierten Journalismus dienen (vgl. dazu den Folgeabschnitt 
3.22): 

Seit 2018 wird automatisierter Journalismus beschrieben als „seltener, institutio- 
nell aber vollwertig integrierter Teil der publizistischen Vielfalt“ (Haim und Graefe 
2018b: 146). In Abgrenzung zu weiteren Formen des Computational Journalism 
beziehungsweise dem Einsatz von Algorithmen in den Medien (vgl. Diakopoulos 
2019: Loosen und Solbach 2020) sind für die Forschungsrelevanz des automati- 
sierten Journalismus vor allem zwei Kriterien ausschlaggebend, die bereits kurz in 
der Einleitung angesprochen werden: zum einen können Algorithmen im automati- 
sierten Journalismus „[ilm Rahmen der menschlich erzeugten Regelwerke [...] bei 
der computergenerierten Berichterstattung autonom entscheiden“ ( Dörr 2016b zit. 
n. Dörr 2016a: 251). Zum anderen galt das Verfassen eines Nachrichtentextes bis- 
her als kreative Leistung, die den Menschen vorbehalten war. Das Softwaresystem 
übernimmt eine Funktion, die „has long been considered a distinctly central, and 
indeed human, element of journalism“ Lewis et al. 2019: 409). 


3.2.2 Deskriptiv-empirische sowie modellentwickelnde 
Vorgehen 


Die Wahrnehmung des automatisierten Journalismus durch Journalist:innen, Medi- 
enverantwortliche in verschiedenen Positionen und teilweise auch durch Vertre- 
ter:innen der Softwareanbieter wird in mehreren Studien untersucht (vgl. van Dalen 
2012; Carlson 2014; Young und Hermida 2015; Thurman, Dörr et al. 2017; D. 
Kim und S. Kim 2017; C.-G. Linden 2017a; Kunert 2019; Siren-Heikel et al. 2019; 
Wu et al. 2019; Schapals und Porlezza 2020). In der Regel wurden Experteninter- 
views zur Perspektive der Kommunikator:innen durchgeführt und beispielsweise 
die Bewertung des automatisierten Journalismus oder die eigene Rollenwahrneh- 
mung der Befragten im Umgang mit den Veränderungen erhoben. Journalist:innen 
beschreiben ihre Vorstellung vom Umgang mit automatisiertem Journalismus als 
komplementäre und sich ergänzende Beziehung. Sie reagieren auf automatisierten 
Journalismus mit gemischten Gefühlen: Es werden sowohl positive als auch nega- 
tive Erwartungen geäußert, beispielsweise die Antizipation neuer Berufsfelder oder 
aber ein möglicher Arbeitsplatzverlust (vgl. van Dalen 2012; Carlson 2014). Jour- 
nalist:innen legen in den Befragungen großen Wert darauf, dass sie die Kontrolle 
über „all stages of news processing, especially in the news selection and editing 
phases,,(Wu et al. 2019: 1440) behalten. Fünf Jahre nach den ersten Studien zur 
Kommunikatorperspektive spricht C.-G. Linden (2017a) davon, dass die Zusam- 
menarbeit mit automatisierter Berichterstattung für Journalist:innen sowohl einen 
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Verlust bestimmter Arbeitsplätze im Journalismus bedeutet, zudem neue Kenntnisse 
im Umgang mit der automatisierten Berichterstattung notwendig sind, aber dass 
automatisierter Journalismus auch die „efficiency and job satisfaction with auto- 
mation of monotonous and error-prone routine tasks,,(ebd.: 60) erhöht hat. Neben 
den Befragungen haben Young und Hermida (2015), Fanta (2017) und C.-G. Lin- 
den (20176) außerdem Fallstudien zur Deskription von Anwendungsbeispielen und 
dem Umgang mit automatisierter Berichterstattung in Redaktionen aus verschiede- 
nen Ländern vorgelegt. 

Neben den deskriptiv-empirischen Arbeiten der Kommunikatorforschung haben 
weitere Autor:innen einen Schwerpunkt auf die kommunikationswissenschaftliche 
Modell- und Theorieentwicklung im Zusammenhang mit dem automatisierten Jour- 
nalismus gelegt. Dazu zählen zunächst die Arbeiten von Lewis etal. (2019) und Guz- 
man und Lewis (2020) zur Human-Machine-Communication’. Diesen Ansatz haben 
Dörr (2017) und Mooshammer (2022) um das Konzept der soziologischen Hand- 
lungstheorie und die Konzeption von Software-Agents aus der Techniksoziologie 
ergänzt. Außerdem nutzen Danzon-Chambaud und Cornia (2021) Bourdieus Feld- 
theorie, um den Wandel von Journalismus und Veränderungen im journalistischen 
Feld zu beschreiben sowie ein Forschungsmodell für Folgestudien zur Perspektive 
der Kommunikator:innen im automatisierten Journalismus auszuarbeiten. 

Neben Untersuchungen zu der Wahrnehmung des automatisierten Journalismus 
durch Kommunikator:innen sind seit 2014 verschiedene Studien veröffentlicht wor- 
den, die sich mit der Perspektive der Lesenden beschäftigen. Untersucht wurde 
dazu, wie automatisiert generierte Nachrichten durch Lesende in verschiedenen 
Ländern wahrgenommen werden (vgl. Clerwall 2014; Van der Kaa und Krahmer 
2014; Jung et al. 2017; Haim und Graefe 2017; Graefe, Haim et al. 2018; Wölker 
und Powell 2018; Waddell 2018; Zheng et al. 2018; Melin et al. 2018; Liu und 
Wei 2019; Waddell 2019; Wus 2020; Jia 2020; Tandoc Jr. et al. 2020; Haim und 
Graefe 2018a; Graefe und Bohlken 2020). Die Ergebnisse dieser Arbeiten stellen 
die Grundlage für die vorliegende Studie dar und werden ausführlich in Kapitel 5 
thematisiert. Zusammengefasst lässt sich festhalten, dass automatisiert generierte 
Nachrichtentexte von den Lesenden als ausreichend glaubwürdig beschrieben wer- 
den. Im Vergleich zwischen automatisiert generierten und von Journalist:innen ver- 
fassten Nachrichtentexten nehmen sie nur geringe Unterschiede hinsichtlich der 
bewerteten Glaubwürdigkeit, Fachkenntnis und Lesbarkeit wahr. Die Studiener- 
gebnisse zeigen außerdem, dass Lesende nicht eindeutig zuordnen können, ob 
die vorgelegte Nachricht von Journalist:innen verfasst oder durch algorithmische 


7 Guzman (2019) plädiert dafür diese Ansätze zur Kommunikatorforschung in Folgestudien 
verstärkt auch auf die Perspektive der Lesenden zu übertragen. 
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Systeme generiert wurde: Automatisiert generierte Nachrichtentexte sind „not 
visually distinct from traditional — manually produced - forms of news“ (Thurman 
2020: 185). 


3.3 Umsetzung in der Praxis 


Im Folgenden werden die Technologie und die Funktionsweise des automatisier- 
ten Journalismus dargelegt. Zudem wird die Marktentwicklung der automatisierten 
Berichterstattung grob nachgezeichnet und es erfolgt ein Überblick über ausge- 
wählte Softwareanbieter. Im Anschluss werden exemplarisch automatisiert gene- 
rierte journalistische Texte im deutschen Journalismus vorgestellt. Dieser Überblick 
soll einen Einblick in die praktische Umsetzung des automatisierten Journalismus 
geben und dient als Vorbereitung für das darauf folgende Kapitel zur Einordnung 
der Chancen und Grenzen des Technologieeinsatzes. 


3.3.1 Prozess, Technologie und Funktionsweise 


Im Eingabe-Verarbeitungs-Ausgabemodell des automatisierten Journalismus in 
Abbildung 3.1 ist der Prozess der automatisierten Berichterstattung® dargestellt 
(vgl. Dörr 2016b: 704). Das Modell orientiert sich am Eingabe-Verarbeitungs- 
Ausgabemodell, das Latzer etal. (2014) entwickelt haben und zeigt, dass die wesent- 
lichen Schritte der journalistischen Nachrichtenproduktion in vergleichbarer Weise 
auch im automatisierten Journalismus vollzogen werden. Außerdem illustriert die 
Abbildung, warum im automatisierten Journalismus häufig von einer ‚Black Box‘ 
gesprochen wird: Journalist:innen sind nur bei der Eingabe und bei der Verwendung 
des Outputs beteiligt. Sie haben keine Berührungspunkte im Verarbeitungsprozess — 
damit wirkt dieser Vorgang wie eine Blackbox ohne menschliche Beteiligung. Jour- 
nalist:innen sind zwar nicht Teil des Datenverarbeitungsprozesses, allerdings wird 
im Modell nicht berücksichtigt, dass die Regeln zur Selektion und der Relevanzbe- 
wertung (im Modell ‚Selection‘ und ‚Assingment of Relevance‘) bei der Program- 
mierung und im Training der Softwaresysteme — insbesondere beim Einsatz der 
Textautomatisierung im Journalismus — eng mit Journalist:innen entwickelt wer- 
den und sich damit die Vorstellung einer Blackbox relativiert. Im Modell ist auch 
im Ausgabeschritt eine Interaktion mit den Nutzer:innen dargestellt. Dazu sei dar- 
auf hingewiesen, dass in einigen Redaktionssystemen eine Freigabe automatisiert 


8 Hier sei explizit erwähnt, dass es sich in dieser Modellierung nicht um Textautomatisierun- 
gen wie ChatGPT handelt, die mit Large Language Modellen arbeiten. 
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generierter Texte durch die Nutzer:innen, also die Journalist:innen vorgesehen ist 
und in anderen Anwendungsbeispielen die Texte direkt aus dem Softwaresysteme 
ohne weitere menschliche Interaktion veröffentlicht werden. Das Modell verdeut- 
licht erneut, dass eine ausreichend hohe Menge an Daten zur Verfügung stehen 
muss, um automatisierte Berichterstattung realisieren zu können. 


Code 
Input Throughput Output 
Request Use of Results 
- content g publication on off- or 
determination Feedback 5 S online-platform 
- e.g. journalistic ? èg i 
genre, tonality, text 5 £5 $ + E 3 5 i 
length, date, place, 3335 se g 
etc. 2228 E33: 
225 E 935 
853 52232 
285 s835 
Feedback 
(intemallexternal) 


[_JUser Interface EEE] Database [_] Algorithm —> Data Flow +++» Feedback Loop 


Abbildung 3.1 Das Eingabe-Verarbeitungs-Ausgabemodell des automatisierten Journalis- 
mus. (Quelle: Dörr 2016b: 704 in Anlehnung an Latzer et al. 2014; Reiter und Dale 2000) 


Umgesetzt wird automatisierter Journalismus mit Algorithmen und Software- 
systemen, die sich hinsichtlich der Komplexität ihrer Umsetzung und der Qualität 
ihres Outputs unterscheiden. Im Wesentlichen können zwei Modelle ausgemacht 
werden: Lückentextmodelle und Natural-Language-Generation-Verfahren (kurz: 
NLG). Aktuell werden vor allem NLG-Verfahren mit enger Anbindung an Redak- 
tionen und manuellem Training durch Journalist:innen eingesetzt. Neuere Entwick- 
lungen, wie z. B. das selbstlernende Modell GPT-3 sind — zum aktuellen Stand 
(Februar 2023) — zu fehleranfällig und die Qualität ist zu gering für die journalisti- 
sche Nachrichtenproduktion (vgl. Loosen und Solbach 2020: 187). Selbstlernende 
Verfahren werden deshalb nur für einzelne Projekte eingesetzt”. 


? Für diese Texte haben Journalist:innen die GPT3-Technologie verwendet, um einzelne Text- 
teile oder ganze Artikel zu generieren. In der Regel wurden die erzeugten Texte von den 
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Bei der Analyse der Funktionsweise der automatisierten Berichterstattung ist zu 
berücksichtigen, dass vor allem die komplexen Softwaresysteme häufig als Betriebs- 
geheimnisse der Softwareanbieter geschützt werden. Es gibt wenige Informationen 
aus den Medienorganisationen und externen Dienstleistern über die konkreten Funk- 
tionsweisen, die Trainingsdaten, die definierten Sprachregeln und die verwendeten 
Datenbanken. Dies erschwert insgesamt die wissenschaftliche Untersuchung und 
Beobachtung des automatisierten Journalismus. Informationen sind vor allem über 
Forschungsprojekte wie Allen et al. (2010), Haarmann und Sikorski (2015), das 
finnische Projekt zur kommunalen Wahlberichterstattung (vgl. Melin et al. 2018: 
43358; Leppänen et al. 2017) oder das Structured-Story-Projekt (vgl. Caswell und 
Dörr 2018) bekannt. 


Lückentextmodelle 

Lückentextverfahren können in einfache und fortgeschrittene Modelle unterteilt 
werden. Die einfachste Möglichkeit, automatisiert generierte Nachrichten zu erzeu- 
gen, sind Lückentextmodelle, wie sie mit dem ‚Homocide Reports‘ oder dem 
‚Quake-Bots‘ umgesetzt wurden (vgl. Abschnitt 3.3.2): Im Wesentlichen wird dabei 
ein fertig geschriebener journalistischer Text mit einzelnen Informationen aus einer 
Liste an Daten kombiniert. Der Algorithmus setzt an der festgelegten Stelle im Text 
die jeweilige Information ein. Fortgeschrittene Lückentextmodelle funktionieren im 
Prinzip ähnlich, wobei diese nicht mit einem fertigen Text arbeiten, sondern dafür 
mehrere Textsegmente und meist eine höhere Anzahl an Daten zur Verfügung ste- 
hen. Für die Erstellung einer Nachricht werden die verschiedenen Bausteine nach 
einer festgelegten Regel miteinander kombiniert. Wenn ausreichend Daten vorhan- 
den sind und entsprechende Regeln zur Kombination definiert wurden, kann ein 
Algorithmus beispielsweise einen Sieg in einem Basketballspiel als ‚erwartbar‘ oder 
als ‚überraschend‘ beschreiben. Dazu wertet das Programm Daten zu vergangenen 
Begegnungen beider Mannschaften aus oder analysiert, wie viele Körbe in welcher 
Zeit geworfen wurden, und versucht auf diese Weise die Spielstatistik zu interpre- 
tieren. Im Vergleich zu den einfachen Lückentexten werden die Möglichkeiten der 
Textgenerierung mit den fortgeschrittenen Modellen zwar erheblich erweitert, den- 
noch werden auch hier die Grenzen des Lückentextverfahrens deutlich (vgl. Loosen 
und Solbach 2020: 187): Alle Textkombinationen müssen von Entwickler:innen 
bedacht und im Programm umgesetzt werden. 


Redakteur:innen kontrolliert, verändert und manuell zur Veröffentlichung freigegeben. Ein 
breiter Einsatz der Technologie mit regelmäßigen und wiederkehrenden Veröffentlichungen 
konnte im deutschen Journalismus ebenso wenig beobachtet werden wie der Einsatz der 
Technologie ohne eine enge Anbindung an und Kontrolle durch Journalist:innen (vgl. auch 
Abschnitt 3.3.3). 
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Verfahren der natürlichsprachlichen Textgenerierung (NLG) 

Die Entwicklung von Natural-Language Generation-Verfahren!®, übersetzt als 
natürlichsprachliche (vgl. Bateman 2010) oder automatisierte Textgenerierung (vgl. 
Haim und Graefe 2018b), erweitert die Möglichkeiten der computergenerierten 
Nachrichtenberichterstattung wesentlich. Im Gegensatz zu den Lückentextverfah- 
ren werden keine vordefinierten Textbausteine und Datensätze miteinander kom- 
biniert. Das Computerprogramm soll vielmehr mit der Struktur und Funktions- 
weise menschlicher Sprache umgehen können!! und dazu in Datensätzen relevante 
Informationen identifizieren und in Texte übertragen können. Natürlichsprachliche 
Textgenerierung wird nicht nur im Journalismus, sondern beispielsweise auch im 
E-Commerce eingesetzt, wobei an automatisiert generierte Nachrichtentexte sehr 
hohe Qualitätsanforderungen gestellt werden (vgl. Leppänen et al. 2017)!?. Die not- 
wendigen Voraussetzungen für den Einsatz von NLG-Verfahren sind ausreichend 
vorhandene Daten, im Journalismus ist er zudem erst möglich, seitdem sich durch 
das Internet die Publikations- und Distributionsmöglichkeiten wesentlich verein- 
facht haben (vgl. Haim und Graefe 2018b: 149). 

Die konkrete Umsetzung von natürlichsprachlicher Textgenerierung im Journa- 
lismus beschreiben Haim und Graefe (2018b), Diakopoulos (2019) und Loosen und 
Solbach (2020) und identifizieren mehrere Schritte: Daten sammeln, Informatio- 
nen identifizieren, Informationen priorisieren, Narrativ erstellen und Text generie- 
ren (vgl. Haim und Graefe 2018b: 150 ff.; Diakopoulos 2019: 98-101)'?. Im ers- 
ten Schritt werden den Systemen meist Kombinationen „aus aktuellen Fakten, [...] 
Meta-Informationen [...] sowie historischen Daten‘ (Haim und Graefe 2018b: 151) 
zur Verfügung gestellt. In diesen Daten versucht das System im zweiten und dritten 
Schritt relevante Informationen zu identifizieren und anschließend „gewissermaßen 
de[n] Nachrichtenwert einzelner Informationen“ (ebd.: 151) zu bestimmen. Dazu 


10 Der Einsatz dieser Technologie geht auf die seit den 1950er Jahren betriebene Forschung 
zur natürlichsprachlichen Textgenerierung in der Informatik und Computerlinguistik zurück 
(vgl. Menzel 2010: 18 f.). 


l Dazu werden die Algorithmen unter anderem in Syntax, der Semantik und Morphologie 
einer Sprache ebenso wie in Stilistik und Metrik trainiert und mit einer großen Anzahl an 
Wissensdatenbanken wie Wörterbücher, Lexika, Textkorpora und NLG-Bibliotheken verbun- 
den. 

12 Leppänen et al. (2017) haben Anforderungen an NLG-Systeme formuliert, die sich bei der 
Anwendung im Journalismus ergeben. Sie beziehen sich auf „the journalistic process (requi- 
rements for transparency and accuracy), the system itself (modifiability and transferability, 
fluency) and the application of the system (data availability and topicality)‘ (ebd.: 189). 

13 Zusätzlich beschreibt Diakopoulos (2019: 98-101) Möglichkeiten, die erstellten Texte 
durch automatisiert generierte Inhalte wie Fotos, Datenvisualisierungen etc. zu ergänzen (vgl. 
ebd.: 102-107). 
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greift die Software auf zuvor definierte Regeln zurück, bei denen aktuell hoher 
Abstimmungsbedarf mit Journalistiinnen und Medienorganisationen besteht. Im 
vierten Schritt erfolgt die Textplanung: Hier wird festgelegt, welche Daten verwen- 
det und welche Inhalte an welcher Stelle kommuniziert werden. Dazu werden zum 
Beispiel die Überschrift und der Teaser grob strukturiert. Im fünften Schritt findet 
die Satzplanung statt und es werden beispielsweise das Sprachniveau, die Zeitstufe 
oder das genutzte Vokabular festgelegt. Damit wird ein Vorteil der NLG-Systeme 
deutlich: Die Schritte eins bis vier werden ohne konkreten Bezug der zu verwende- 
ten Sprache vollzogen, das heißt das System berücksichtigt erst im letzten Schritt, 
in welcher Sprache der Textoutput erfolgen soll. Ein NLG-System kann - sofern 
Sprachdatenbanken verbunden und trainiert sind — Nachrichtentexte in beliebiger 
Sprache ausgeben (vgl. Haim und Graefe 2018b: 150ff.; Horacek 2010: 436 ff.). 

Insgesamt sind „aktuelle Systeme imstande, unterschiedliche Informationen aus 
den Daten zu extrahieren, diese zu bewerten, zu priorisieren und daraus schließ- 
lich ein adäquates Narrativ zu konstruieren“ (Haim und Graefe 2018b: 159). Die 
Anwendung der NLG-Verfahren im Journalismus ist bisher für Softwareanbieter 
und Medienorganisationen zeit- und ressourcenaufwendig, da ein enger Austausch 
mit Journalist:innen stattfinden muss, um die Modelle zu trainieren und überdies 
hohe Qualitätsanforderungen an journalistische Produkte gestellt werden. In der 
Aufarbeitung der technologischen Funktionsweise wird auch deutlich, dass NLG- 
Systeme für jeden Anwendungsfall neu aufgesetzt und trainiert werden müssen: 
Wenn das System für Fußballberichterstattung optimiert ist, kann es ohne Konfigu- 
ration keine Boulevardberichte verfassen. 

Aktuell bleiben NLG-Anwendungen, so resümieren Haim und Graefe (ebd.) 
im Journalismus „hinter ihren technologischen Möglichkeiten zurück“ (ebd.: 153). 
Seit 2020 sind außerdem Arbeiten erschienen, die den automatisierten Journalismus 
verstärkt als KI-Anwendung beschreiben (vgl. z. B. Biswal und Gouda 2020: 162; 
Graßl et al. 2022: 7; Loosen und Solbach 2020: 179£.), ohne dabei im Detail auf 
die Definition des KI-Begriffs oder die Funktionsweise der Systeme einzugehen. 
Auch fortgeschrittene NLG-Verfahren operieren mit KI-Algorithmen, wie neurona- 
len Netzen, um große Datenmengen zu verarbeiten oder Markow-Ketten, um unsin- 
nige Wortkombinationen auszuschließen. Modelle wie GPT-3 und KI-Verfahren, 
die selbst-lernend und ohne enge Anbindung an journalistische Produktionsrouti- 
nen regelmäßig Nachrichten erzeugen, sind zum jetzigen Zeitpunkt (Februar 2023) 
im deutschen Journalismus nicht im Einsatz!*. 


14 In den Praxisbeispielen wird auf die Kolumne ‚Anic T. Wae‘ hingewiesen. Diese arbeitet 
mit dem GPT-3 Modell, ist aber eng an das Projektteam angebunden; zudem werden keine 
informierenden Texte veröffentlicht (vgl. ausführlich in Abschnitt 3.3.3). 
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3.3.2 Marktentwicklung und ausgewählte Anbieter 


Die Entwicklung des Markts für automatisierten Journalismus kann im Wesentli- 
chen in vier Phasen unterteilt werden: Als Anfänge der computergenerierten Bericht- 
erstattung werden die Jahre zwischen 2010'° und 2012, als frühe Marktphase die 
Jahre zwischen 2012 und 2016 bezeichnet und ab 2017 wird von der Institutionali- 
sierung des automatisierten Journalismus gesprochen. Zusätzlich ist ab 2022 durch 
verstärkte — und öffentlich zugängliche — KI-Anwendung ein Technologiesprung zu 
beobachten, der mit einer Ausweitung der Anwendung einhergeht. 

In den Jahren 2010 bis 2012, den Anfängen des automatisierten Journalismus, 
werden vor allem in den USA erste Projekte in der Praxis initiiert und einzelne 
Nachrichtentexte automatisiert generiert. Zudem werden Forschungsprojekte an 
Universitäten aufgebaut, Patente zur journalistischen Textgenerierung angemeldet 
und erste Unternehmen zur natürlichsprachlichen Textgenerierung im Journalis- 
mus gegründet. Als erste Anwendungsbeispiele der automatisierten Berichterstat- 
tung gelten der ‚Homicide Report‘ und der Quake-Bot der Los Angeles Times (vgl. 
Danzon-Chambaud und Cornia 2021: 1). Die Zeitung führt 2010 die automatisierte 
Berichterstattung auf ihrem Blog ‚Homicide Report‘ (Los Angeles Times 2007) 
ein: Mit dem Blog sollte seit 2007 über jeden Mordfall im Bezirk berichtet wer- 
den, was bisher — unter anderem, weil zu wenig personelle Ressourcen vorhanden 
waren, um über jeden Fall zu berichten — nicht gelungen war. Deshalb setzen die 
Verantwortlichen mit dem Relaunch einen Algorithmus ein, der für jeden Mordfall 
eine automatisiert generierte Nachricht mit wesentlichen Angaben veröffentlicht. 
Diese Meldungen können nach der Veröffentlichung von Journalist:innen zusätz- 
lich editiert werden (vgl. Young und Hermida 2015: 386). Zusätzlich entwickelt der 
Digitalredakteur der Zeitung 2014 einen Algorithmus zur automatisierten Bericht- 
erstattung über Erdbeben in der Region: Dazu wertet der so genannte Quake-Bot 
die Daten des U.S. Geologcial Survey-Instituts aus und erzeugt eine Nachrichten- 
meldung mit den wichtigsten Informationen, sobald ein Erdbebenalarm ausgelöst 
wird (vgl. Oremus 2014; Graefe 2016, S. 19-20). Weiterhin werden 2010 bezie- 
hungsweise 2011 die Unternehmen ‚Narrative Science‘ und „Automated Insights‘ 
gegründet, zwei Softwareanbieter, die in den USA als Marktführer im Bereich der 


!5 Es sei darauf hingewiesen, dass es schon vor 2010 Pilotprojekte gab, die als Vorreiter 
des automatisierten Journalismus gelten. So hat Glahn (1970) Wettervorhersagen mit Text- 
vorlagen erzeugt und Meehan (1977) einen Algorithmus zur automatisierten Erstellung von 
Märchenerzählungen vorgestellt. Insgesamt beschäftigt sich die Computerlinguistik seit den 
1950er Jahren mit natürlichsprachlicher Generierung von Texten, die Anwendung im Journa- 
lismus erfolgt aber weitestgehend seit 2007, beziehungsweise verstärkt ab 2010 (vgl. Horacek 
2010: 635). 
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automatisierten Berichterstattung gelten (vgl. Dörr 2017: 13). Der Gründer von 
Automated Insights, Robbie Allen, hat 2006 ein Programm geschrieben, das auto- 
matisiert Basketball-, Fußball- und Baseballspiele auswertet und jeweils Spielbe- 
richte generiert. Dies ist die Grundlage und Geschäftsidee für das Unternehmen 
Automated Insights, welches er 2010 gründet. Narrative Science dagegen geht auf 
ein Forschungsprojekt der Northwestern University zurück. In Zusammenarbeit mit 
privaten Unternehmen entwickelt die Forschungsgruppe des StatsMonkey-Projekts 
2010 einen Algorithmus zu automatisierter Berichterstattung über Basketballspiele 
(vgl. Allen et al. 2010) und lässt sich diesen im selben Jahr unter dem Namen ‚Quill‘ 
patentieren (vgl. Latar 2015). 

Als frühe Marktphase des automatisierten Journalismus gelten die Jahre 2012 
bis 2016: Die Anwendungsfelder der automatisierten Berichterstattung werden viel- 
fältiger, die Technologie wird optimiert und Redaktionen in den USA und Europa 
experimentieren mit den Textalgorithmen (vgl. Dörr 2017: 46f.; Graefe 2017: 5; 
Thurman 2020: 180f.). Zudem werden weitere Unternehmen gegründet, die NLG- 
Technologie im Journalismus anbieten beziehungsweise diese Produkte in ihr Port- 
folio aufnehmen (vgl. Dörr 2017: 14ff.). Auch die Kommunikationswissenschaft 
beginnt, sich mit automatisierter journalistischer Berichterstattung auseinanderzu- 
setzen: Zunächst gibt es erste Beschreibung des Gegenstands und es werden Stu- 
dien zur Perspektive und Wahrnehmung der Kommunikatoren (vgl. van Dalen 2012; 
Young und Hermida 2015) durchgeführt. Ab 2014 werden außerdem Arbeiten zur 
Wahrnehmung der Lesenden publiziert (vgl. Kapitel 5). Young und Hermida (2015) 
fassen den Untersuchungsgegenstand, noch ohne eigene Bezeichnung, als Phäno- 
men des Computational Journalismus auf und analysieren, dass dieser als „part of a 
much earlier and yet-ongoing turn to digital within journalism, framed within broa- 
der organizational, technological, and social contexts [Herv. i. Org.]“ (ebd.: 383) zu 
verstehen sei (vgl. dazu auch Carlson 2014; Haim und Graefe 2018b: 145 f.). Dörr 
(2017) nimmt zudem eine technologische Potentialanalyse, eine Analyse des öko- 
nomischen Marktes sowie die Einordnung des automatisierten Journalismus in das 
Journalismus-Modell von Weischenberg et al. (2006) vor. Auf Basis dieser Analysen 
befinde sich, so der Autor, der automatisierte Journalismus entweder „in an experi- 
mental market phase or in an early stage of the market expansion phase“ (Dörr 2017: 
17). Zudem deute die Integration der automatisierten Berichterstattung in profes- 
sionelle Medienorganisationen bereits auf eine beginnende Institutionalisierung auf 
organisatorischer Ebene hin (vgl. ebd.: 17). Nach der Anfängen des automatisier- 
ten Journalismus sind computergenerierte Nachrichtentexte 2016 in ausgewählten 
Redaktionen weltweit angekommen, die Anwendungsfelder werden breiter, eine 
Reihe von Unternehmen wirbt um Medienorganisationen als Kund:innen und es 
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sind erste Anzeichen für eine Institutionalisierung und dauerhafte Verankerung der 
Medieninnovation im Journalismus zu beobachten. 

Ab 2016 sprechen zum Beispiel Haim und Graefe (2018b) davon, dass automati- 
sierter Journalismus in den Redaktionen insgesamt zwar noch eher selten vorkommt, 
aber „institutionell [als] vollwertig integrierter Teil der publizistischen Vielfalt anzu- 
sehen und mit denselben normativen Erwartungen konfrontiert [ist] wie andere For- 
men des Journalismus“ (ebd.: 146) (vgl. auch Thurman 2020: 189). Damit ist die 
Medieninnovation des automatisierten Journalismus in den Redaktionen fest ver- 
ankert und als Untersuchungsobjekt der Kommunikationswissenschaft etabliert. In 
der Praxis ist ab 2016 eine beständige Ausweitung der Themen und Anwendungen 
zu beobachten, wenngleich diese in der Forschung an Einzelbeispielen festgemacht 
werden muss: Es existiert keine Übersicht über das Ausmaß der computergene- 
rierten Berichterstattung und den Anteil der automatisiert generierten Nachrichten 
am Journalismus insgesamt. Hierzu führt Dörr (2017) eine Befragung von Soft- 
wareanbietern weltweit durch, die bislang nicht repliziert worden ist. Weitere und 
systematisch aggregierte Informationen zum Einsatz des automatisierten Journalis- 
mus sind aus den Medienorganisationen nicht vorhanden. Gerade in Deutschland 
gibt es wenige als solche gekennzeichnete automatisiert generierte Texte, damit fal- 
len auch gängige kommunikationswissenschaftliche Methoden zur Untersuchung 
des Gegenstands, etwa Inhaltsanalysen, weg. Neben den bekannten Einsatzgebie- 
ten des automatisierten Journalismus in Deutschland (vgl. Abschnitt 3.3) sind in 
der Praxis auch Projekte zu beobachten, bei denen automatisierte Berichterstat- 
tung integriert und mit weiteren journalistischen Formen wie Sensorjournalismus 
verbunden ist: Im Projekt „Superkühe“ des WDR verbinden die Journalist:innen 
drei Kühe mit verschiedenen Sensoren und generieren aus diesen Daten automati- 
siert digitale Kuh-Tagebücher, um Lesende über Milcherzeugung in Deutschland zu 
informieren (vgl. WDR 2017). Als internationale Vorreiter im automatisierten Jour- 
nalismus gelten die Washington Post mit ihrer Eigenentwicklung ‚Heliograf‘ oder 
der ‚Dreamwriter‘ des chinesischen Unternehmens Tencent (vgl. C.-G. T. Linden 
et al. 2019: 20, 23). 

Ende des Jahres 2022 ist eine erneute Veränderung zu beobachten, die sich aus 
der Weiterentwicklung beziehungsweise dem vereinfachten Zugang zur zugrun- 
deliegenden Technologie ergibt: Mit der Veröffentlichung von GPT-2 und GPT- 
3 ist ein Technologiesprung denkbar, der auch die Anwendung und Verbreitung 
der automatisierten Berichterstattung im deutschen Journalismus verändert (vgl. 
Kapitel 1). Softwareanbieter und Entwickler:innen sprechen zwar noch davon, dass 
sie zur automatisierten Berichterstattung vor allem elaborierte und vielfältige Vor- 
lagen verwenden (vgl. Osterhaus 2020) und bisher sind keine Anwendungsbei- 
spiele einen routinierten Einsatz von KI-Verfahren zur regelmäßigen Produktion 
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informierender Darstellungsformen bekannt (vgl. Abschnitte 3.1 und 3.3.1), mit 
dem Projekt ‚Anic T. Wae‘ erscheint aber bereits im November 2022 eine monatli- 
che deutsche Kolumne, die auf GPT-3 basiert (vgl. ausführlich in Abschnitt 3.3.3). 
Auch die wissenschaftliche Einordnung verändert sich. So besprechen beispiels- 
weise Graßl et al. (2022), Loosen und Solbach (2020) die automatisierte Textgene- 
rierung unter KI-Verfahren im Journalismus. Zum Zeitpunkt der Entstehung dieser 
Arbeit kann keine weiterführende Einordnung dieser Entwicklung erfolgen, die 
möglichen Veränderungen sind zu beobachten. 


3.3.3 Exemplarische Anwendung: Sport- und 
Coronaberichterstattung sowie KI-Kolumne 


Exemplarisch sollen im Folgenden Anwendungsbeispiele vorstellt werden, die 
den Einsatz des automatisierten Journalismus in Deutschland verdeutlichen. Dazu 
werden a) die Sportberichterstattung als typisches Anwendungsbeispiel für nicht- 
gekennzeichnete standardisierte Nachrichtentexte, b) ein Beispiel aus der Corona- 
Berichterstattung sowie c) das Projekt Anic T. Wae als erste deutsche KI-Kolumne 
dargestellt. Weitere Praxisbeispiele zum Beispiel aus den USA, Indien, Europa, 
China, Südkorea beschreiben unter anderem Fanta (2017), Dörr (2017), C.-G. T. 
Linden et al. (2019), Rojas Torrijos und Toural Bran (2019), Biswal und Gouda 
(2020), Moravec et al. (2020) und Jia (2020). 


Automatisiert generierte Fußballberichte 
In der deutschen Fußballberichterstattung gibt es mehrere Portale beziehungsweise 
Softwareanbieter, die mit automatisierter Berichterstattung werben oder in Hinter- 
grundberichten darüber sprechen, wenngleich die einzelnen Texte selten als auto- 
matisiert generierte Berichte gekennzeichnet sind. Als großer deutscher Softwa- 
reanbieter für automatisierte Textgenerierung — nicht nur im Journalismus — gilt das 
Unternehmen Retresco, das in Kooperation mit Sportplatz Media die Software ‚tex- 
tengine‘ entwickelt hat. Laut eigener Angaben wird textengine unter anderem für 
das Portal fussball.de des Deutschen Fußball-Bunds (vgl. Retresco GmbH 2019), für 
die Berichte von bfv.de des Bayerischen Fußballverbands (vgl. Bayerischer Fußball- 
Verband 2019; Dilger 2019), für das Portal reviersport.de (vgl. Gizinski 2017) sowie 
Jfussifreunde.de (vgl. Haim und Graefe 2018b: 143; Retresco GmbH 2017) und trans- 
fermarkt.de (vgl. Gizinski 2017) verwendet. 

Soweit bekannt, kommen vor allem Texttemplates und wenig KI-basierte Verfah- 
ren zum Einsatz (vgl. Osterhaus 2020). Die Medienportale und Zeitungen arbeitenin 
den Redaktionen entweder direkt mit der Software oder übernehmen fertige Texte, 
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die Retresco liefert. Zusätzlich kann das System direkt in die Content-Management- 
Systeme der Medienorganisationen eingebunden werden, beispielsweise um Texte 
direkt zu veröffentlichen. Die Datengrundlage für die textengine sind mehrere Sport- 
datenbanken, z. B. die des Deutschen Fußball-Bunds (vgl. ebd.). 

Auch über Schwierigkeiten der automatisierten Fußballberichte ist berichtet wor- 
den. So spricht Dilger (2019) von „holzschnittartigen“ (ebd.) und wenig authenti- 
schen Berichten. Kurios muten zudem automatisierte Spielberichte über spannende 
0:0-Begegnungen zweier Mannschaften an, obwohl diese Spiele nicht stattgefunden 
haben. Die Wettkämpfe wurden verschoben oder abgesagt, und die Software veröf- 
fentlichte dennoch automatisiert Spielberichte (vgl. Pauler 2019; Kruse 2020). Die 
Softwareentwickler:innen berichten außerdem von Sonderfällen, die die Maschine 
— ohne menschliche Korrektur des Algorithmus — nicht sinnvoll umsetzen kann. So 
sind beispielsweise Fußballberichte von Gefängnismannschaften wenig hilfreich, 
wenn die Maschine über zukünftige Auswärtsspiele schreibt (vgl. Osterhaus 2020). 
Insgesamt seien die Fehler der automatisierten Fußballberichterstattung aber ver- 
schwindend gering und man sei zufrieden mit den Ergebnissen, so zitiert Pauler 
(2019) Verantwortliche von welt.de. 


Automatisierte bzw. hybrid erzeugte Corona-Berichterstattung 

Die Rheinische Post beziehungsweise deren Onlineportal RP ONLINE hat seit 2020 
hauptsächlich während der Corona-Pandemie tagesaktuell automatisiert generierte 
Berichte zu den Covid-Zahlen und der Entwicklung der Pandemie veröffentlicht 
(vgl. Boisserée et al. 2022). Dieses Fallbeispiel wurde zusammen mit weiteren Bei- 
spielen mit den Teilnehmenden der Focus Groups besprochen und ihnen dazu ein 
Screenshot der Berichterstattung aus dem Sommer 2022 gezeigt. Der Screenshot 
zeigt einen die Überschrift, die Autor:innenzeilen sowie die ersten Textabschnitte 
sowie zusätzlich die Endnote mit den Hinweisen zur Datenquelle und dem Trans- 
parenzhinweis. Die Berichte sind in Zusammenarbeit mit Retresco und der bereits 
erwähnten Textgenerierungssoftware entstanden. Als Datengrundlage nutzen die 
Verantwortlichen die frei verfügbaren Daten des Robert-Koch-Instituts. 

Markiert werden die Texte als ‚interaktiv‘ als Autor:innen wird das Team der 
redaktionellen Produktentwicklung angegeben und als Autor:innenfoto das Porträt 
des Teamleiters eingesetzt. Am Ende des Textes wird ein Transparenzhinweis ange- 
geben, der auf die Datengrundlage und die Automatisierung verweist: „Dieser Text 
wurde auf Grundlage der RKI-Daten automatisch generiert und wird jeden Morgen 
automatisch aktualisiert‘ (ebd.). 

In der Projektbeschreibung bewirbt Retresco das Projekt wie folgt: „Seit dem 
Start des Projektes im Juli 2020 trugen die automatisierten Texte zum überdurch- 
schnittlichen Anstieg der Reichweite von RPONLINE bei“ (Retresco GmbH 2022) 
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und spricht davon, dass die Rheinische Post neben der Corona-Berichterstattung 
auch automatisierte Verkehrsberichte und Wahlberichterstattung nutzt und weitere 
Projekte angedacht seien. 


Anic T. Wae 

In der Tageszeitung taz, die tageszeitung erscheint seit November 2022 monatlich 
sowohl in Print als auch online die ‚Kolumne Intelligenzbestie‘. Als Autor:in wird 
Anic T. Wae vorgestellt, „die erste Ko-lum-nis-t*in [...] einer deutschsprachigen 
Zeitung, die kein Mensch ist“ (Kilg et al. 2022). Anic T. Wae ist ein Maschine- 
Learning-System, das von einem Team aus Journalist:innen, Entwickler:innen und 
Interessierten!® trainiert wurde und fertige Texte an die Redaktion liefert. Anic T. 
Wae schreibt aus Sicht einer Maschine über das Verhältnis zu Menschen. Bis Januar 
2023 wurden drei Kolumnen veröffentlicht: Im November 2022 stellte Anic sich 
und das Projekt den Leser:innen vor (vgl. Wae 2022a), im Dezember schrieb es über 
den Sinn von Weihnachten (vgl. Wae 2022b) und im Januar 2023 verliebte sich Anic 
und äußerte sich über Gefühle und Emotionen (vgl. Wae 2023). 

Das Projekt zielt darauf ab, mit Leser:innen in Kontakt zu treten, über techno- 
logische Veränderungen in der Gesellschaft zu sprechen und diese zu reflektieren. 
Mit einem computergenerierten Autor:innenfoto und der Möglichkeit zum Dialog 
wird versucht, Anic T. Wae zu personalisieren. Die Lesenden sind aufgerufen, sich 
zum Beispiel mit E-Mails oder Leser:innenbriefe an Anic T. Wae zu wenden. Die- 
sem Aufruf sind bislang knapp 80 Personen gefolgt!” . Einige der Leser:innenbriefe 
wurden von der Zeitung veröffentlicht (vgl. z. B. taz, die tageszeitung 2023). Die 
Anschlusskommunikation übernimmt das Team hinter Anic und verwendet dazu in 
der Regel die Textgenerierungssoftware, um Antworten auf eingehende Anfragen 
zu generieren. In den Antworten wird darauf hingewiesen, dass Anic T. Wae und 
das Team gemeinsam die Kommunikation übernehmen. 

Erstellt werden die Kolumne und die Anschlusskommunikation von einem 
Maschine-Learning-System, das auf dem GPT-3-Modell des US-Unternehmens 
OpenAl basiert und durch das Team für das Projekt angepasst wird. Das Team 
behält sich zudem vor, weitere Sprachmodelle zu testen und das System weiter- 
zuentwickeln (vgl. Kilg et al. 2022). Weitere Informationen zum System sowie 
die Möglichkeit für Lesende, Anic selbst zu testen, werden im Hintergrundartikel 
verlinkt (vgl. Kilg et al. 2022; Turing Agency 2023). 


16 Aus Gründen der Transparenz sei darauf hingewiesen, dass die Verfasserin dieser Arbeit 
am Projekt beteiligt ist (vgl. Kilg et al. 2022). Ein Teil des Projektteams besteht zudem 
aus Mitgliedern der TuringAgency, ein Schweizer Kollektiv, das KI in kreativen Kontexten 
verwenden und gesellschaftlichen Dialog und Reflexion zum Einsatz von KI bewirken will. 


17 Ende Januar 2023 spricht das Projektteam von etwa 80 Kontaktaufnahmen. 
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Für jede Kolumne schreibt das Team mehrere so genannter Prompts. Prompts 
funktionieren wie Themenvorschläge und dienen dem Sprachmodell als Grundlage 
für die weiteren Berechnungen der Textgenerierung. Mit den Prompts werden ver- 
schiedene Texte erzeugt, woraus das Team eine Vorauswahl an möglichen Kolum- 
nentexten erstellt: „Wir wählen die besten Texte anhand von Eigenschaften wie zum 
Beispiel Unterhaltungswert, Lesefluss, Fantasie, Humor, Tiefgang, überraschende 
Kohärenz oder überraschende Unsinnigkeit. Manchmal müssen wir sehr oft auf 
Anics Knöpfe drücken, bevor ein Text in der richtigen Länge und Qualität heraus- 
kommt“ (Kilg et al. 2022). Texte, die in der Qualität oder der Länge nicht ausrei- 
chen, werden aussortiert. Zur Qualitätskontrolle gehört zum Beispiel die Prüfung 
auf rassistische, sexistische oder in anderer Weise menschenverachtende Inhalte. 
Abschließend wählt das Team den finalen Text aus. Dieser wird nicht verändert; Es 
erfolgt beispielsweise keine Rechtschreibprüfung — die Lesenden sollen vielmehr 
einen Einblick in die Möglichkeiten und Grenzen des Systems bekommen. Der aus- 
gewählte Finaltext wird an die raz-Redaktion geschickt, hier können redaktionelle 
Änderungen wie etwa die Korrektur von Tippfehlern ausgeführt werden. Die ver- 
wendeten Prompts und die damit generierten unveränderten Texte werden auf der 
Projektseite veröffentlicht (vgl. Kilg et al. 2022; Turing Agency 2023). 


3.4 Aktuelle Debatten in Forschung und Anwendung zum 
Technologieeinsatz 


Nach der Beschreibung des automatisierten Journalismus werden im Folgenden 
Chancen und Risiken des Einsatzes der automatisierten Berichterstattung sowie 
offene Fragen zum Umgang mit der Technologie aufgeführt. Die Arbeit vermittelt 
einen Überblick über mögliche positive und negative Auswirkungen des automati- 
sierten Journalismus und blickt damit über die Deskription hinaus auf mittel- und 
langfristige Veränderungen im Journalismus. Im Sinne der vorliegenden Arbeit liegt 
der Schwerpunkt der Ausführungen vor allem auf der Perspektive der Lesenden und 
dem gesellschaftlichen Umgang mit Journalismus. 


3.4.1 Antizipierte Chancen und Grenzen 


Die antizipierten Chancen und Grenzen, die sich mit dem Einsatz der automati- 
sierten Berichterstattung mittel- und langfristig im Journalismus ergeben, werden 
im Folgenden aufgeführt und zusammenfassend in Abbildung 3.2 dargestellt. Die 
Ausführungen orientieren sich an der Definition von Journalismus in Kapitel 2, den 
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Ausführungen von Haim und Graefe (2018b) und thematisieren die Auswirkungen 
des automatisierten Journalismus anhand der Mikro-, Meso- und Makroebene. Ins- 
gesamt muss bei der Einordnung des automatisierten Journalismus auf allen Ebenen 
die Grenze der Technologie berücksichtigt werden: Automatisierter Journalismus 
ist für repetitive Aufgaben geeignet und kann nur umgesetzt werden, wenn eine 
ausreichend hohe Menge an strukturierten Daten zur Verfügung steht. Automati- 
sierter Journalismus ist nicht geeignet, um „selbstständig Sinnzusammenhänge zu 
erschließen, aufkommende Themen adäquat zu erfassen oder eigene Standpunkte 
in der Diskussion zu entwickeln“ (ebd.: 153 f.). 

Für Leser:innen und Journalist:innen führt eine Ausweitung der computergene- 
rierten Berichterstattung auf der Mikroebene zu zwei wesentlichen Veränderungen: 
Das Nachrichtenangebot erhöht sich und Arbeitsroutinen von Kommunikator:innen 
verändern sich (vgl. Graefe 2017: 18f.; Diakopoulos 2019: 135f.). Das Angebot 
journalistischer Inhalte steigt zunächst quantitativ, indem mit den Softwaresyste- 
men kostendeckend auch Nischen- oder Special-Interest-Themen bedient bezie- 
hungsweise ein bestehendes geringes Angebot erweitert werden kann (vgl. Haim 


Journalist:innen Journalist:innen 

* neue Aufgaben und ergänzende Tätigkeiten « Stellenabbau bzw. Angst vor Stellenabbau 

+ _ erleichterte Recherche und Konzentration auf * zusätzliche Kompetenzen notwendig 
Kernkompetenzen 

Leserinnen Leserinnen 

*  Angebotserweiterung * Überforderung durch steigendes Angebot 
(quantitativ und Special-Interest, sowie qualitativ) (Anzahl der Nachrichten und Kommunikator:innen) 


* Akzeptanz und Vertrauen ungeklärt 


Medienorganisationen Medienorganisationen 
+ erweitertes Angebot für bestimmte Inhalte + mehr Konkurrenz durch weitere Akteur:innen 
* Nischenthemen werden lukrativ (long-tail) * neue Anforderungen 


* Ansprache neuer Teilpublika/Zielgruppen und damit (z.B. eigene Datensätze aufbauen und pflegen) 
steigende Werbeeinnahmen * offene Fragen, wie Transparenz, Medienrecht, 
steigende Qualität informierender Darstellungsformen Akzeptanz der Leser:innen 

durch Auslagern von Routinetätigkeiten 

* Kosteneinsparungen durch sinkende variable Kosten 
* frei werden Ressourcen von Journalist:innen 


Mesoebene 


Zivilgesellschaft Zivilgesellschaft 
* erweitertes Angebot für Nischenthemen bedeutet mehr | + Suche nach Orientierung bei steigendem 
Aufmerksamkeit für gesellschaftliche Gruppen Kommunikationsaufkommen 


* Angst vor Zersplitterung/,„Filterbubble“-Phänomenen 

* offene Fragen, wie ethischer Einsatz, 
Verantwortlichkeitsregelungen, kritisch-sensible 
Berichterstattung 


Abbildung 3.2 Antizipierte Chancen und Risiken des automatisierten Journalismus. 
(Eigene Darstellung in Anlehnung an Graefe (2017), Haim und Graefe (2018b)) 
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und Graefe 2018a: 201). Neben der Erhöhung der Nachrichtenanzahl wird auch die 
„Expansion des Angebots in die Tiefe“ (Graefe, Haim et al. 2018: 154) erwartet. 
Damit ist gemeint, dass automatisiert generierte Nachrichten in Bezug auf Länge, 
Sprache, Blickwinkel, oder Frames für verschiedene Publika oder individuelle Nut- 
zer:innen und deren persönliche Präferenzen angepasst werden können (vgl. Graefe 
2017: 21; Diakopoulos 2019: 112; Jia 2020: 2613). Hierfür sind individuelle Distri- 
butionskanäle sowie Daten zu den Interessen und dem Nutzungsverhalten der Lesen- 
den notwendig (vgl. Graefe, Haim et al. 2018: 154). Das vergrößerte Angebot kann 
gleichzeitig aber auch zu einer Überforderung der Lesenden bei der Auswahl und 
Bewertung von Nachrichteninhalten führen (vgl. Haim und Graefe 2018a: 203). Die 
Anforderungen an die Medienkompetenz des Publikums steigt, wenn aus normativer 
Sicht automatisiert generierte Nachrichten kritisch-reflexiv begleitet werden sollen. 
Unklar ist weiterhin, ob Lesende automatisiert generierte Nachrichten akzeptieren 
und ihnen Vertrauen zuschreiben. Daneben verändert automatisierter Journalismus 
Aufgaben und Tätigkeitsfelder von Journalist:innen. Es ist zu erwarten, dass mittel- 
und langfristig die Automatisierung von Routinetexten, standardisierten Textteilen 
oder repetitiven Schreibaufgaben weiter zunehmen wird (vgl. Diakopoulos 2019: 
108-114). Diese Veränderung kann als Chance und Risiko gleichermaßen gese- 
hen werden: Der Wegfall repetitiver Aufgaben birgt die positive Erwartung, dass 
Journalist:innen mehr Ressourcen für ihre Kernkompetenzen aufbringen können. 
Dazu gehört beispielsweise die Einordnung von Fakten, die Recherche von Hinter- 
gründen, die Verifikation von Fakten, die Erkundung neuer Phänomene und Inno- 
vationen sowie bestimmte journalistische Darstellungsformen wie Interviews oder 
Reportagen. Gleichzeitig liegt in der Automatisierung und dem damit verbundenen 
Wegfall von Routinetätigkeiten auch ein Risiko für einen Stellenabbau (vgl. auch 
Tandoc Jr. et al. 2020: 550). Eine großflächige Bedrohung von Arbeitsplätzen sei 
zwar nicht zu befürchten (vgl. Graefe, Haim et al. 2018: 149) dennoch ist die Angst 
vor dem Stellenabbau ein Risiko für Journalistiinnen. Zudem werden durch auto- 
matisierten Journalismus weitere Tätigkeiten von Journalist:innen sowie gänzlich 
neue Aufgabenfelder relevant: Neben der klassischen Schreibarbeit, so Haim und 
Graefe (2018b), werden verstärkt Video-, und Bildformate, die Content-Curation 
oder die Moderation von Leser:innen-Diskussionen (vgl. ebd.: 154) nachgefragt. 
Um mit neuen Aufgaben umgehen zu können, müssen sich Journalist:innen zusätz- 
liche Kompetenzen und Fähigkeiten aneignen. Außerdem werden gänzlich neue 
Berufe entstehen: Zum Beispiel müssen die NLG-Systeme konfiguriert, gewartet 
und betreut oder umfangreiche Datensätze aufbereitet werden (vgl. Graefe 2017: 
23; C.-G. Linden 2017b: 136). Der automatisierte Journalismus birgt für Journa- 
list:innen also gleichermaßen Risiken und Chancen (vgl. auch Graefe 2017: 28 ff.). 
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Auf der Mesoebene können Medienorganisationen durch automatisierten Jour- 
nalismus ihr Angebot erweitern und Nachrichten auch in Nischenthemen anbie- 
ten (vgl. Graefe 2017: 36-38; Loosen und Solbach 2020: 188). Zudem können 
bestehende Angebote wie umfangreiche Darstellungsformen mit steigender Qua- 
lität angeboten werden (vgl. Haim und Graefe 2018b: 154): Durch hybride Text- 
generierung, welche die Vorteile der automatisierten Berichterstattung und die der 
journalistischen Arbeit verbindet, können Fehler vermieden und große Datensätze 
verarbeitet werden. Automatisierter Journalismus bietet für Medienorganisationen 
außerdem die Möglichkeit, Kosten einzusparen, indem — nach der Implementation 
und der Bereitstellung der notwendigen Datengrundlage — keine weiteren Ausgaben 
für Journalist:innen notwendig sind, sodass die variablen Kosten der produzierten 
Nachrichtentexte sinken (vgl. Haim und Graefe 2018b: 155; Loosen und Solbach 
2020: 188) und zusätzlich Ressourcen von Journalist:innen für andere Tätigkeiten 
frei werden. Die technologische Möglichkeit, durch Algorithmen Nachrichten zu 
einem bestimmten Thema in großer Anzahl und mit mindestens zufriedenstellender 
Qualität anzubieten, birgt weiterhin die Chance, neue Teilpublika und Zielgrup- 
pen anzusprechen und damit eine Steigerung der Werbeeinnahmen zu verzeichnen 
(vgl. Diakopoulos 2019: 114 ff.). Gleichzeitig sehen sich Medienorganisationen aber 
auch mit dem Risiko konfrontiert, dass neue Intermediäre auftreten und Nachrich- 
tenangebote für das Publikum und die eigene Zielgruppe bereitstellen. Damit steigt 
die Konkurrenz für Medienorganisationen. Wie erwähnt funktioniert automatisier- 
ter Journalismus nur, wenn ausreichend zuverlässige und strukturierte Daten zur 
Verfügung stehen. Deshalb müssen Medienorganisationen im Bereich der Daten- 
sammlung und des Datenmanagements neue Kompetenzen aufbauen und Strukturen 
schaffen, um eigene Datensätze aufzubauen und zu pflegen (vgl. dazu auch Graefe 
2017: 22f.; Haim und Graefe 2018a: 203; Thurman 2020: 188; Diakopoulos 2019: 
117£f., 135£.). Auf organisatorischer Ebene sind einige offene Fragen bisher nicht 
beantwortet, zum Beispiel die, wie ein transparenter Umgang der Organisationen mit 
automatisiertem Journalismus aussehen kann. Unbeantwortet bleiben zudem Fra- 
gen des Medienrechts und der Verantwortlichkeiten bei automatisiert oder hybrid 
verfassten Texte, wenn beispielsweise Fehler auftreten. Medienorganisationen fehlt 
weiterhin Wissen über die Akzeptanz der automatisierten Berichterstattung durch 
die Lesenden oder über deren Bereitschaft, für automatisiert generierte Inhalte zu 
bezahlen. Einige dieser Fragen werden im Folgenden gesondert angesprochen. 

Die quantitative Erhöhung des Nachrichtenangebots wird mittel- und langfris- 
tig zu mehr Berichterstattung auch zu Nischenthemen führen (vgl. Diakopoulos 
2019: 137). Aus normativer Perspektive schafft dies auf gesellschaftlicher Ebene die 
Chance, mehr Aufmerksamkeit für im öffentlichen Dialog bisher unterrepräsentierte 
Gruppen zu generieren und einen gesamtgesellschaftlichen Austausch zu fördern. 


40 3  Forschungsobjekt: automatisierter Journalismus 


Als mögliches Risiko des großflächigen Einsatzes von automatisierter Berichterstat- 
tung ist auf der Makroebene die erschwerte Suche nach Orientierung im erhöhten 
Nachrichtenangebot durch das Publikum zu berücksichtigen. Hier wird über die 
Befürchtung einer Zersplitterung des gesellschaftlichen Dialogs und so genannte 
Filterbubble oder Echochamber-Phänomene gesprochen (vgl. Graefe 2017: 39f.; 
Haim und Graefe 2018b: 155f.; Kunert 2019: 140). Die Kommunikationswissen- 
schaft konnte bisher zwar keine eindeutigen Ergebnisse über die Existenz dieser 
Entwicklungen erzielen, die Befürchtungen dazu werden aber häufig angespro- 
chen (vgl. dazu auch Heise 2016: 206; Prochazka 2020: 15f.; Haim und Graefe 
2018b: 155£.). Auch die Teilnehmenden der in der vorgelegten Arbeit durchgeführ- 
ten Studie thematisieren diese Sorge in Bezug auf gesellschaftliche Auswirkungen 
des automatisierten Journalismus (vgl. Kapitel 8). Abschließend sind auch auf der 
Makroebene zahlreiche offene Punkte festzuhalten, wie beispielsweise der ethische 
und wertorientierte Einsatz der automatisierten Berichterstattung im Journalismus, 
Verantwortlichkeitsregelungen oder Kontrollgremien für den Umgang mit Fehlern 
und die Gewährleistung einer kritisch-sensiblen Berichterstattung. 


3.4.2 Ethische und rechtliche Herausforderungen sowie offene 
Fragen 


Im Folgenden werden ethische und rechtliche Herausforderungen aufgeführt, die 
sich mit dem Einsatz von automatisierter Berichterstattung ergeben. Einige dieser 
Diskussionspunkte beziehen sich dabei nicht nur auf den automatisierten Journa- 
lismus, sondern werden auch in angrenzenden Bereichen geführt: Die Frage der 
Datengrundlage und Pflege großer Datensätze betrifft nicht nur den vorliegenden 
Untersuchungsgegenstand, und der Umgang mit selbstlernenden Algorithmen, die 
gesellschaftlich relevante Aufgaben übernehmen, wird nicht nur im Journalismus 
thematisiert. Die Zusammenstellung soll einen Überblick über relevante rechtliche 
und ethisch-normative Herausforderungen geben, die sich aktuell im Umgang mit 
automatisierter Berichterstattung ergeben. Dabei sind für den Zweck dieser Studie 
vor allem die Perspektive des Publikums und die Herausforderungen des zivilge- 
sellschaftlichen Umgangs mit automatisiertem Journalismus relevant. 


1. Transparenz und Nachvollziehbarkeit 
Im automatisierten Journalismus wird ein transparenter und für das Publi- 
kum nachvollziehbarer Prozess der Nachrichtenproduktion gefordert (vgl. z. B. 
Diakopoulos und Koliska 2017; Graefe 2017: 34). Dabei bleibt bislang offen, 
was Transparenz oder Nachvollziehbarkeit konkret bedeuten, welche 
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Umsetzungsmaßnahmen gefordert und erwartet werden, welche Informationen 
im automatisierten Journalismus offengelegt und welche Prozesse nachvollzieh- 
bar gestaltet werden können'®. Als Mindestvoraussetzung für einen transparen- 
ten Einsatz des automatisierten Journalismus wird die Kennzeichnung automati- 
siert generierter oder hybrid erzeugter Texte gefordert (vgl. Porlezza 2020: 151; 
Haim und Graefe 2018b: 156; Diakopoulos und Koliska 2017: 816f.). Wei- 
tere Erwartungen betreffen zusätzliche Informationen zur Nachvollziehbarkeit 
der Datengrundlage und der verwendeten Algorithmen. Dabei wird auf eine 
möglicherweise schwierige Umsetzung der Erwartungen an Transparenz hinge- 
wiesen: die verwendeten Algorithmen werden meist als Geschäftsgeheimnisse 
der Softwareanbieter geschützt. 
2. Qualität der Datengrundlage und Pflege der Datensätze 

Die notwendige Voraussetzung für automatisiert generierte Nachrichten sind 
in ausreichender Menge und Qualität zur Verfügung stehende Daten. Deshalb 
wurde bereits auf die Notwendigkeit hingewiesen, dass Medienorganisationen 
eigene Datensammlungen aufbauen und Prozesse zur Datenpflege betreiben. 
Die Herausforderung im automatisierten Journalismus ist die Datensammlung 
aus allen gesellschaftlichen Bereichen und Gruppen sowie der Umgang mit 
möglicherweise verzerrten Daten, welche wiederum zu einer voreingenomme- 
nen (‚biased‘) Berichterstattung führen können. Die Frage ist, wie eine ausge- 
wogene automatisierte Berichterstattung realisiert werden kann, wie gesamtge- 
sellschaftlich die Qualität und Pflege der Datensätze und die Verifikation von 
Daten im automatisierten Journalismus gewährleistet werden kann (vgl. Dia- 
kopoulos 2019: 119 ff.). Porlezza (2020) spricht in diesem Zusammenhang das 
Problem des „blinden Vertrauens in die Faktizität von Daten an“ (ebd.: 148), 
die sowohl Journalist:innen als auch die Rezipient:innen betreffen kann. Empi- 
rische Belege für die Existenz dieses Phänomens sind zwar bisher gering, aber 
der Hinweis, dass es im Umgang mit automatisiertem Journalismus Kompe- 
tenzen braucht, um den Output automatisierter Systeme bewerten zu können, 
um ggf. regulatorische Änderungen an der Datengrundlage vornehmen oder die 


18 Porlezza (2020) argumentiert, dass Journalismus nicht vollständig transparent agieren kann, 
weil stets Abwägungen mit anderen Werten wie etwa Daten- oder Quellenschutz getroffen 
werden müssen (vgl. ebd.: 147). Demgegenüber steht das Argument, dass Journalismus — 
aus einer konstruktivistischen Perspektive — auch nicht vollständig objektiv agieren kann, 
aber Objektivität trotzdem als anzustrebender Wert in der journalistischen Berichterstattung 
gilt. Dieses Argument kann auch auf die Transparenzforderung übertragen werden: Selbst 
wenn eine vollständige Transparenz im automatisierten Journalismus aus unterschiedlichen 
Gründen nicht erreicht werden kann, gilt ein transparenter Umgang der Medienorganisationen 
mit automatisiert generierten Nachrichten als anzustrebendes Ideal. 
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Funktionsweise der Algorithmen verändern zu können, ist an dieser Stelle hilf- 
reich. Notwendig sind dafür zum einen Journalist:innen, die speziell im Umgang 
mit Datenmengen ausgebildet und für mögliche Verzerrungen sensibilisiert sind, 
und zum anderen Kontrollinstanzen, die automatische Systeme und deren Out- 
puts überprüfen können. 


. Medienrecht und Notwendigkeit gesetzgeberischen Regulierung 


Eine Herausforderung im automatisierten Journalismus besteht darin, dass neben 
Journalist:innen und Redaktionen weitere Akteur:innen auftreten wie etwa Soft- 
wareentwickler:innen, Agenturen und Anbieter von Datensätzen. Deshalb wird 
„die Zuweisung von Verantwortung bei Fehlern schwieriger“ (Haim und Graefe 
2018b: 145). Allerdings weisen sowohl Dreyer und Heldt (2020), Habel (2019) 
den möglichen Vorwurf zurück, dass automatisierter Journalismus im rechts- 
freien Raum agieren würde: „Der bestehende Ordnungsrahmen für eine medi- 
enrechtliche Haftung ist in den meisten Fällen ausreichend, eine personenbe- 
zogene Verantwortlichkeit für (rechtsverletzende) Äußerungen ist [...] auch bei 
Roboterjournalismus herstellbar. Dadurch stellen sich Fragen der Haftung von 
Algorithmen oder Kl als eigene Rechtsperson im Medienrecht regelmäßig nicht. 
Das Ergebnis steht im Einklang mit der wichtigen gesellschaftlichen Funk- 
tion von journalistischer Berichterstattung und den dadurch bedingten hohen 
Anforderungen an die Erfüllung journalistischer Sorgfaltspflichten“ (Dreyer 
und Heldt 2020). Ausführlicher ordnet Habel (2019) automatisierten Journa- 
lismus!? in bestehendes Medienrecht ein und überprüft dazu unter anderem 
Patent-, Urheber-, Leistungsschutz- und Datenschutzrecht und geht zudem auf 
Verantwortlichkeiten und Haftungsfragen ein, die sich auf die zugrundeliegen- 
den Datenbanken und Sprachmodelle beziehen (vgl. dazu auch Ombelet et al. 
2016). Auch eine Kennzeichnungspflicht automatisiert generierter Nachrich- 
ten könne aus dem Prinzip der Meinungsfreiheit abgeleitet werden, die Aus- 
gestaltung dieser Pflicht müsse vom Gesetzgeber ebenso ausgestaltet werden 
wie die konkrete Anwendung des Urheberrechts für computergenerierte Inhalte 
(vgl. Habel 2019: 302 f.). So könnten beispielsweise Softwareanbieterfirmen im 
Impressum der jeweiligen Webseiten mit aufgeführt werden. 


19 Er verwendet den Begriff Roboterjournalismus und unterscheidet zwischen internem und 
externem Roboterjournalismus, also Projekten, die ‚In-House‘ in den jeweiligen Medienor- 
ganisationen entwickelt wurden und solchen, die in Zusammenarbeit mit externen Softwa- 
reanbietern umgesetzt werden. 
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4. Kontrolle automatisierter Systeme und weitere Maßnahmen zur ‚algorith- 
mic accountability‘ 
Neben Fragen des Medienrechts gehören zum normativ-ethischen Umgang mit 
automatisierten Systemen im Sinne der ‚algorithmic accountability‘? definierte 
Regeln zum Einsatz automatisierter Systeme, die kritische Begleitung durch 
gesellschaftliche Gremien und ausgewählte Akteur:innen sowie Möglichkeiten 
der Kontrolle des jeweiligen Outputs. Im Umfeld des automatisierten Journalis- 
mus werden dazu unter anderem Selbstverpflichtungen der Medienorganisatio- 
nen zum verantwortungsvollen Umgang und externe Kontrollgremien diskutiert 
sowie eine Verständigung über die Rechte der Nutzer:innen gefordert (vgl. Dörr 
2016a: 256; Dörr und Hollnbuchner 2017: 11 f.; Porlezza 2020: 152; Loosen und 
Solbach 2020: 196). Diese Kontrollinstanzen sollen beispielsweise die Möglich- 
keit bieten, die „Korrektheit algorithmenbasierter Entscheidungen zu überprüfen 
und anzufechten“ (Citron 2007 zit. n. Heise 2016: 207 £.). Eine reine Selbstre- 
gulierung der Medienorganisationen geht einigen Autor:innen dabei nicht weit 
genug: dafür ist das Thema ‚automated news‘ zu komplex geworden (vgl. Por- 
lezza 2020: 153). 

Zusätzlich wird eine „stärkere Einbindung der Öffentlichkeit in die kritische 
Begleitung und Gestaltung algorithmengesteuerter Systeme [...] angeregt, etwa 
durch die Möglichkeit, Designs und Tests automatisierter Systeme einzusehen 
und zu kommentieren [Herv. i. Org.]“ (Heise 2016: 207). Außerdem solle For- 
schung zur algorithmic accountability im Medienumfeld intensiviert werden und 
sich interdisziplinär und multiperspektivisch mit dem Gegenstand, möglichen 
Veränderungen sowie mittel- und langfristigen Perspektiven auseinandersetzen 
(vgl. Porlezza 2020: 153). 

5. Entwicklung eines kritisch-reflexiven Umgang des Publikums 
Neben den angesprochenen Maßnahmen zur algorithmic accountability besteht 
eine weitere Herausforderung darin, das Publikum oder die Nutzer:innen auto- 
matisiert generierter Systeme mit ausreichend Fähigkeiten und Kompetenzen im 
Umgang mit diesen auszubilden. Hier werden zunächst eine generelle Sensibili- 
sierung der Bevölkerung hinsichtlich des Einsatzes algorithmischer Systeme in 
gesellschaftlich relevanten Bereichen und weitere „Kompetenzen zum kritisch- 
reflexiven Umgang mit algorithmischen Medien“ (Heise 2016: 207) gefordert. 
Dabei ist bisher nicht geklärt, welche Kompetenzen konkret benötigt werden 


20 Mit ‚algorithmic accountability‘ sind sowohl die Kontrolle und Überprüfbarkeit algorith- 
mischer Systeme als auch die Frage der Verantwortungsübernahmen algorithmischer Ent- 
scheidungen gemeint (vgl. Heise 2016: 207). 
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und wie sich die Bevölkerung diese algorithmic literacy aneignen kann (vgl. 
ebd.: 207). 

6. Gesamtgesellschaftlicher Umgang mit Verfahren der Künstlichen Intelli- 
genz in gesellschaftlich-relevanten Bereichen 
Die angesprochenen Herausforderungen zur Herstellung einer algorithmic 
accountability im automatisierten Journalismus gelten verstärkt, wenn ange- 
nommen wird, dass automatisiert generierte Nachrichten mittelfristig vermehrt 
mit Verfahren der Künstlichen Intelligenz umgesetzt werden. Es ist eine gesamt- 
gesellschaftliche Aufgabe, einen verantwortungsvollen Umgang beim Einsatz 
von automatisierten Systemen zu finden, die gesellschaftlich relevante Aufgaben 
übernehmen. Dies gilt auch — aber nicht nur — für den automatisierten Journalis- 
mus. (vgl. Porlezza 2020: 149 £.,157). Zu einem verantwortungsvollen Umgang 
gehört zum Beispiel eine Verständigung darüber, was unter ‚Künstlicher Intel- 
ligenz‘ zu verstehen ist, in welchen Bereichen und für welche Aufgaben der 
Einsatz von KI-Verfahren sinnvoll ist und wo Grenzen des Einsatzes liegen. 
Außerdem müssen Maßnahmen zur Qualitätssicherung und Kontrolle der Sys- 
teme umgesetzt werden und Prozesse zum Umgang mit Fehlern und die Mög- 
lichkeit zum Widerspruch installiert werden. Zudem sind rechtliche Fragen zur 
Verantwortlichkeit und zur Haftung zu klären und ggf. neue oder veränderte 
Regularien müssen durch den Gesetzgeber erfolgen. Aus normativ-ethischer 
Sicht müssen die Rechte der Bevölkerung thematisiert werden, eine Stärkung 
der individuellen Rechte Einzelner muss erfolgen und eine Diskussion darüber 
entstehen, welche Kompetenzen - im Sinne einer algorithmic literacy — Personen 
brauchen, um einen kritisch-reflexiven Umgang auszubilden. 


3.5 Zwischenfazit I: automatisierter Journalismus 


Mit dem Begriff ‚automatisierter Journalismus‘ wird die Möglichkeit beschrie- 
ben, durch Einsatz entsprechender Software automatisiert journalistische Inhalte 
zu erzeugen. Nachdem ein Algorithmus initial implementiert und trainiert wurde, 
kann jede Stufe der Nachrichtenproduktion — von der Datensuche und der Datenana- 
lyse über die eigentliche Produktion eines Beitrags bis hin zur Veröffentlichung — 
automatisiert, das heißt ohne weitere menschliche Intervention, erfolgen. Die Algo- 
rithmen arbeiten mit natürlichsprachlicher Generierung und sind besonders für die 
Auswertung und Versprachlichung von quantitativen Analysen geeignet, da die Ver- 
fahren am zuverlässigsten funktionieren, wenn eine große Anzahl digitaler, struktu- 
rierter und verlässlicher Daten vorhanden ist. Seit 2010 sind automatisiert generierte 
oder hybrid erzeugte Textnachrichten unter anderem in der Sport-, Finanz-, Wetter-, 
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Boulevard-, Verkehr- oder Wahlberichterstattung zu finden und mittlerweile gibt 
es weltweit Anwendungsbeispiele. Veröffentlicht werden die Texte sowohl online 
als auch in Printausgaben von Zeitungen und Zeitschriften (vgl. Abschnitt 3.3.1 
zur Technologie und den Praxisanwendungen). Grundsätzlich ist der automatisierte 
Journalismus nicht auf die Erstellung von Texten beschränkt, so finden sich auch 
Praxisbeispiele und Forschungsergebnisse zum Beispiel zur automatisierten Video- 
produktion, die aber nicht Schwerpunkt der vorliegenden Arbeit ist. 

Als Besonderheit des automatisierten Journalismus wurde in Abschnitt 3.1 aus- 
geführt, dass automatisierter Journalismus als Medieninnovation im übergeordneten 
Medienwandel der Automatisierung einzuordnen ist. Auf dieser Einordnung fußt 
die vorliegende Arbeit und schließt sich damit unter anderem an Dörr (2017) an, der 
den automatisierten Journalismus als Kern des aktuellen Medienwandels bezeich- 
net (vgl. ebd.: 3). Für die Perspektive der Lesenden ist, neben den genannten unter- 
schiedlichsten Einflüssen und Implikationen des automatisierten Journalismus auf 
allen Ebenen des Mediensystems vor allem interessant, dass 


e es keine Kennzeichnungspflicht oder -regelungen zur Kenntlichmachung von 
automatisiert generierten Texten gibt. Es gibt überdies keine Selbstverpflichtung 
der Redaktionen oder Medienorganisationen zur Kennzeichnung oder keine — 
wie auch immer geartete — Verständigung auf einheitliche und für das Publikum 
wiedererkennbare Verfasser:innenzeilen oder Endnoten, die die Automatisierung 
und die Urheberschaft anzeigen oder erklären. In der Praxis kennzeichnen nur 
wenige Medienhäuser ihre automatisiert generierten Inhalte. Lesende konsumie- 
ren daher automatisiert generierte oder hybrid verfasste Texte auch ohne, dass 
sie von der Urheberschaft wissen (können). 

e esin der allgemeinen Berichterstattung wenig Aufklärung und Hintergrundin- 
formation für das Publikum über die aktuell stattfindenden Automatisierungs- 
vorgänge aller Art im Journalismus gibt. 

e von Seiten der Forschenden kritisiert wird, dass zu wenige Kenntnisse über die 
Perspektive der Lesenden vorhanden sind (vgl. Limitationen der Rezeptionsstu- 
dien in Abschnitt 6.1). 

e in Zukunft von veränderter Nachrichtenauswahl und -rezeption der Lesen- 
den, zum Beispiel durch weiter fragmentierte Contentanbieter und Nutzer: 
innengruppen auszugehen ist. 


Im Umgang mit automatisiertem Journalismus ist das Handeln des Publikums (ob 
bewusst oder unbewusst) von einer Vielzahl an Unsicherheiten beziehungsweise 
durch eine Beschränkung von Informationen und Wissen beeinflusst. Die Ent- 
scheidung, ob Lesende automatisiert generierten oder hybrid verfassten Inhalten 
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vertrauen, treffen sie mit einer Reihe an Heuristiken und mit begrenzten Ressour- 
cen: Lesende vertrauen der Zuverlässigkeit der Programmierleistung sowie der Voll- 
ständigkeit des Trainings der Algorithmen (meist durch Journalist:innen in den 
Redaktionen oder durch Softwareentwickler:innen der Softwareanbieter). Lesende 
vertrauen auf die korrekte und vollständige Einbindung der automatisierten Verfah- 
ren in redaktionelle Entstehungs- und Überprüfungsprozesse von Nachrichten und 
vertrauen hier auch darauf, dass bestehende Kontroll- und Korrekturmechanismen 
in den Medienorganisationen auf die automatisierte Berichterstattung ausgewei- 
tet wird. Hier mag eingeworfen werden, dass Rezipierende auch bislang wenig 
oder in sehr unterschiedlichem Maß Kenntnisse über die journalistische Ausbil- 
dung, den Redaktionsalltag, über Mediennetzwerke, über das Zusammenspiel von 
Redaktionen und Nachrichtenagenturen, die Nachrichtenauswahl und -produktion 
oder Verfahren zur Korrektur von Fehlern haben. Wichtig ist, dass mit dem automa- 
tisierten Journalismus die Komplexität der Nachrichtenentstehung und damit auch 
die Anforderungen an die Media Literacy der Konsument:innen, um den Wahrheits- 
gehalt einer Nachricht zu überprüfen oder die Entstehung der Berichte einzuordnen, 
steigt. Außerdem erhöhen sich die Anforderungen, wenn Nachrichten bewertet und 
Vertrauens- oder Misstrauensurteile gefällt werden. Wie Lesende mit der erhöhten 
Komplexität umgehen, und ob diese Einfluss auf das bewertete und entgegenge- 
brachte Vertrauen in journalistische Inhalte hat, ist ein Schwerpunkt dieser Arbeit. 
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Vertrauen in Journalismus A 


In der kommunikationswissenschaftlichen Vertrauensforschung gibt es zwei erste 
grundlegende Forschungslücken: Zum einen liegt der Schwerpunkt der (jüngeren) 
Forschung häufig auf sinkendem oder fehlendem Medienvertrauen, wobei mitt- 
lere Vertrauensniveaus wenig differenziert betrachtet werden (vgl. Prochazka 2020: 
269f.). Zum anderen konnte die Forschung bislang zeigen, dass Vertrauen ein hoch- 
komplexes Konstrukt mit unterschiedlichen Dimensionen, Bedingungen, Einfluss- 
faktoren und Folgewirkungen ist, und monokausale Erklärungen für Vertrauens- 
zuschreibungen zu kurz greifen. Im Forschungsstand wird deutlich, dass weitere 
Studien zur Entstehung oder Beeinflussung des Journalismusvertrauens notwendig 
sind, um — insbesondere im Umgang mit neuen Technologien — Vertrauen als kom- 
plexes Konstrukt zu begreifen und Vertrauenszuschreibungen umfassender nach- 
vollziehen zu können (vgl. van Dalen 2019: 356). Für einen systematischen Über- 
blick über die bisher erzielten Forschungsergebnisse zu Vertrauen in Journalismus 
und die anschließende Verortung der für diese Arbeit relevanten Forschungsfragen 
stehen zunächst ein kurzer Forschungsüberblick sowie die Systematisierung der 
Medienbewertungsforschung im Vordergrund. Anschließend werden ‚Vertrauen‘ 
als allgemeiner Begriff sowie Medien- beziehungsweise Journalismusvertrauen mit 
den Bezugsobjekten und den Arten der Vertrauensbeziehungen thematisiert. Ziel ist 
eine fundierte Begriffsbestimmung, auf der anschließend die Operationalisierung 
von Journalismusvertrauen erfolgt und der Forschungsstand zu dessen Bedingungen 
und Einflussfaktoren dargestellt wird. Abschließend erfolgt ein Überblick über aktu- 
elle deskriptive Befunde zu Vertrauen in Journalismus in Deutschland. Aufbauend 
auf der Ausarbeitung der Vertrauensforschung wird in Kapitel 6 das Forschungs- 
modell entwickelt. 

Die Aufarbeitung der Forschung zu Vertrauen in Journalismus ist, wie im Fol- 
genden an mehreren Stellen zu beobachten sein wird, ein vergleichsweise komple- 
xes Unterfangen: Der Forschungsbereich ist sowohl in der Theorie als auch in der 
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Empirie geprägt von teilweise unspezifisch oder unzulänglich definierten Begrif- 
fen, von Konzepten, die sich mit angrenzenden Forschungsgebieten überlappen, 
einer Fülle an Erkenntnissen aus anderen Disziplinen und deren unterschiedliche 
Einbindung in die Kommunikationswissenschaft sowie einem Nebeneinander aus 
akademischer Forschung und (teil-)kommerzieller Mediaforschung (vgl. z. B. Pro- 
chazka 2020: 44). Die Schwierigkeiten in der Begriffsdefinition, der Theoriebildung 
und der empirischen Umsetzung, werden in den Folgeabschnitten (vgl. 4.2.2, 4.2.3 
und 4.3.3) ausführlich thematisiert und für das vorliegende Forschungsinteresse 
möglichst zielführend gelöst. 

Im Mittelpunkt der vorliegenden Arbeit steht das generalisierte Journalismus- 
vertrauen (vgl. ausführlich Abschnitt 4.3.1), welches im Zusammenhang mit der 
automatisierten Nachrichtenberichterstattung untersucht werden soll. Insbesondere 
für die Exploration eines Medienwandels am Beispiel der Medieninnovation des 
automatisierten Journalismus ist es aber notwendig, die starke Fokussierung auf 
generalisiertes Vertrauen an manchen Stellen zu lockern und etwas breiter auch 
artverwandte Themen zu betrachten, um die theoretischen und empirischen Kon- 
zepte in Gänze zu erfassen und weiterentwickeln zu können. Im Folgenden wird 
dokumentiert, warum eine Erweiterung an geeigneter Stelle notwendig ist. 


4.1 Das Forschungsfeld der Medienbewertungen 


Die Komplexität der Forschung zu ‚Vertrauen in Journalismus‘ wurde bereits ange- 
sprochen und so istes wenig verwunderlich, dass sich die Vertrauensforschung nicht 
in klassische Einteilungen des Faches verorten lässt!. Zur Systematisierung des 
Forschungsbereichs unterscheidet beispielsweise Obermaier (2020) zwei grundle- 
gende Ansatzpunkte der kommunikationswissenschaftlichen Vertrauensforschung: 
zum einen a) die funktional-systemorientierte Forschungsperspektive, bei der Ver- 
trauen in das System Journalismus als Teilsystem des Funktionssystems Öffent- 
lichkeit betrachtet wird und zum anderen b) die Auffassung, die Vertrauen in 


! Zum Beispiel die vielzitierte Formel zur Unterteilung der Kommunikationswissenschaft von 
Lasswell (1948) (vgl. z. B. Pürer 2014: 19 f. oder Burkart 2021: 446 ff.): Es gibt Studien, die 
nach der Vertrauensbewertung konkreter Medieninhalte und nach deren Erfüllung journalis- 
tischer Kriterien fragen, also der Medieninhalteforschung zuzuordnen sind. Zudem gibt es 
Erkenntnisse zu Vertrauen im Journalismus, die in den Bereich der Medienwirkungs- und teil- 
weise auch der Mediennutzungsforschung anzusiedeln sind (vgl. z. B. Tsfati 2014) oder sich 
mit der Perspektive der Kommunikator:innen beschäftigen (vgl. z. B. Steindl (2021: 22f.). 
Außerdem prüft Strömbäck et al. (2020) den Zusammenhang zwischen Medienvertrauen und 
Mediennutzung. 
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journalistische Medien beziehungsweise in Journalismus als Institutionenvertrauen 
begreift (vgl. ebd.: 85f.). Dagegen argumentiert Prochazka (2020), dass Lesende 
nicht zwischen der Makro- und Mikroebene des Journalismus unterscheiden und 
damit die aufgeführte strikte Trennung beider Ansätze empirisch nicht umsetzbar sei 
(vgl. ebd.: 43). Er bevorzugt für die Systematisierung der Vertrauensforschung die 
Aufarbeitung der Medienbewertungsforschung, begreift Medienvertrauen ebenso 
als Form des Institutionenvertrauens und systematisiert damit die genannte zweite 
Perspektive weiter. Dazu nennt er c) drei Teilgebiete: die Vertrauensforschung, die 
Medienglaubwürdigkeitsforschung sowie Arbeiten zur Wahrnehmung journalisti- 
scher Qualität (vgl. ebd.: 34). Beide Systematisierungsstrategien strukturieren die 
Vertrauensforschung und ordnen den Forschungsbereich in die Kommunikations- 
wissenschaft ein. Mit einer Darstellung der wesentlichen Bezüge der Vertrauens- 
forschung können das vorliegende Untersuchungsobjekt, das Erkenntnisinteresse 
dieser Arbeit und anschließend die Forschungsfragen und Ergebnisse kontextuali- 
siert und für Anschlussforschung zugänglich gemacht werden. 

Die a) funktional-systemorientierte Perspektive übernimmt Konzeptionen von 
Vertrauen, die insbesondere auf soziologischen Arbeiten zu Vertrauen in abstrakte 
Systeme basieren. Interessant für das vorliegende Forschungsinteresse sind Gründe 
für Vertrauenszuschreibung in abstrakte Systeme: Beispielsweise werden genera- 
lisierte Erfahrungen, allgemeines Vertrauen in Expertensysteme, Sozialisationser- 
fahrungen sowie Erfahrungen mit Repräsentant:innen des Systems genannt (vgl. 
Obermaier 2020: 86; Rühl 2005: 121, 127 f.). Für die funktional-systemorientierte 
Perspektive hat im Wesentlichen Kohring (2004) die soziologischen Ansätze zu Ver- 
trauen in die Kommunikationswissenschaft übertragen, eine Theorie des Vertrauens 
in Journalismus und eine Skala zur Messung desselben entwickelt und validiert (vgl. 
Kohring 2004; Kohring und Matthes 2004; 2007; 2012). Dabei ist die Selektions- 
funktion, die Journalismus leistet, das wesentliche Kriterium an dem sich Vertrauen 
in Journalismus festmachen lässt: Das System Journalismus trifft Selektionsleis- 
tungen. Lesende vertrauen, wenn sie die Kontingenz dieser Selektion wahrnehmen, 
das Risiko der Entscheidung bewerten und daraufhin ihrerseits eine Selektionsleis- 
tung erfolgt”. Kohring (2004) arbeitet dazu vier Dimensionen der Selektionsleistung 


2 Das System Journalismus wird als Leistungssystem des Funktionssystems Öffentlichkeit 
begriffen. Selektionsregeln sind in Programmen festgelegt und ein Ereignis gilt beispielsweise 
als berichtenswert, wenn es als öffentliches Thema in mehreren Systemen behandelt wird. Die 
Lesenden müssen der Richtigkeit journalistischer Selektionsprogramme vertrauen, wenn sie 
aufgrund der Berichterstattung eine eigene Selektionsleistung treffen. Diese Entscheidung ist 
riskant, das Publikum handelt also unter Risiko (vgl. Kohring 2004: 150-160, 165; Obermaier 
2020: 86; Grosser 2016: 1039-1042). Siehe ausführlich auch die Definition von Vertrauen in 
Abschnitt 4.2.2. 
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(Themen- und Faktenselektivität, sowie Richtigkeit und Bewertung) sowie spezi- 
fische, unspezifische und mitteilungs- und kontextbezogene Gründe für die Ver- 
trauenszuschreibungen heraus (vgl. ebd.: 249, 256 f.). Grosser (2016) stellt bezogen 
auf Online-Journalismus im Wesentlichen keine großen Veränderungen hinsichtlich 
der Vertrauenszuschreibung in das Systems Journalismus fest, ergänzt aber weitere 
Kriterien wie die Art der Moderation von Nutzer:innenkommentare oder Populari- 
tätshinweisen wie Likes oder Shares (vgl. ebd.: 1047 f. zit. n. Obermaier 2020: 87 f.) 
Journalismus wird als soziales System begriffen und ist funktionsfähig, wenn jour- 
nalistische (Selektions-)Programme funktionieren und Journalismus ist als System 
bedroht, wenn Programme nicht funktionieren. Die funktional-systemorientierte 
Perspektive der Vertrauensforschung ist vor allem für Folgestudien dieser Arbeit 
interessant, wenn es um die Vertrauensbewertung des automatisierten Journalismus 
mit Auswirkungen auf das System Journalismus als Ganzes geht und beispielsweise 
Fragen zur Stabilität des Systems unter der Automatisierungsbedingung thematisiert 
werden. 

Die Arbeiten zu b) Vertrauen in journalistische Medien beziehungsweise Jour- 
nalismusvertrauen als Form des Institutionenvertrauens nehmen dagegen vor allem 
Bezug auf Modelle der politologischen Vertrauensforschung. Vertrauen beruhe, so 
die Auffassung, im Wesentlichen auf Erfahrungen der Lesenden mit den Leistungen 
der Medien als gesellschaftliche Institution. Für einen Überblick dieser Forschungs- 
perspektive thematisiert Obermaier (ebd.) vier Schwerpunktsetzungen unterschied- 
licher Autor:innen (vgl. ebd.: 89-92), die im Folgenden kurz zusammengefasst wer- 
den: In Zusammenarbeit mit Kolleg:innen leistet zunächst Yarif Tsfati in mehreren 
empirischen Studien Grundlagenarbeit zu Medienskeptizismus und Institutionen- 
vertrauen (vgl. Tsfati 2014; Tsfati und Ariely 2014; Tsfati und Peri 2006)°. Die 
Autor:innen definieren den Grad des Vertrauens als Vergleich zwischen den Erwar- 
tungen der Lesenden an journalistische Medien und den tatsächlichen Wahrnehmun- 
gen. Die Erwartungen entstehen aus den bisherigen Erfahrungen der Rezipierenden. 
Außerdem ergeben sich im Kontakt mit journalistischen Medien oder Journalismus 
und der Medienselektion neue Erfahrungen und demzufolge neue Erwartungen (vgl. 
z. B. Tsfati 2014: 498-500). Dieser Abgleich ist zentrales, aber nicht konstituieren- 
des Merkmal für Vertrauen und Vertrauensbeziehungen: Zusätzlich sind Vertrauens- 
gebende notwendig, die Interesse und Anteil an der Vertrauensentscheidung haben 


3 Der Autor beschäftigt sich zunächst mit Medienskeptizismus und stellt dann verstärkt Ver- 
trauen in den Mittelpunkt seiner Studien (vgl. Obermaier 2020: 89). Medienskeptizismus 
meint die Wahrnehmung, dass Mainstreammedien nicht glaubwürdig oder zuverlässig sind 
(vgl. ausführlicher Begriffsbestimmung und Abgrenzung der Begriffe in Abschnitt 4.2.3). 
Tsfati (2014) wirft beispielsweise die Frage auf, warum Menschen journalistische Inhalte 
konsumieren, denen sie nicht vertrauen (vgl. ebd.: 299). 
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(vgl. ebd.: 498 f. zit. n. Obermaier 2020: 90 sowie vgl. die Definition von Vertrauen 
Abschnitt 4.2.2). Insgesamt spielen für Vertrauensurteile von Rezipient:innen für 
die Autor:innen sowohl „Performanzbewertungen, de[r] gesellschaftlichen Diskurs 
über Medien, Vertrauen in politische Institutionen, aber auch generalisiertes soziales 
Vertrauen“ (ebd.: 89f.) eine Rolle, wobei die Liste an Einflussfaktoren auf Vertrauen 
in journalistische Medien als in der Forschung nicht abschließend bearbeitet ange- 
sehen werden kann (vgl. Tsfati 2014: 491; Tsfati und Ariely 2014: 760-762). Tsfati 
(2014) empfiehlt zusätzlich zu den Wahrnehmungen journalistischer Medien auch 
die Erwartungen an diese in konkreten Merkmalsausprägungen zu erheben (vgl. 
ebd.: 500f.). Ein Vorgehen, das etwa ein Drittel der Rezeptionsstudien zur Wahr- 
nehmung des automatisierten Journalismus im Forschungsstand umsetzt*. Daneben 
begreift Jackob (2012) Vertrauen in journalistische Medien als diffuses Vertrauen 
in eine gesellschaftliche Institution unter vielen. Rezipierende vertrauen journalis- 
tischen Medien, wenn oder indem sie die grundlegenden Funktionen und Prinzipien 
des Mediensystems anerkennen. Die Skala von Kohring und Matthes (2004) ver- 
wendet er nicht und kritisiert, dass diese ‚Vertrauen‘ allein auf die mediale Selekti- 
onsleistung bezieht und weitere Gründe für Vertrauenszuschreibungen außer Acht 
lässt. Er arbeitet weitere medienspezifische sowie medienunspezifische Gründe für 
Vertrauenszuschreibungen wie beispielsweise ein generalisiertes soziales Vertrauen 
heraus’. Politisches Vertrauen steht weiterhin im Schwerpunkt der Arbeit bei J. Mül- 
ler (2013) insbesondere in Abhängigkeit des gesellschaftlich-politischen Systems 
eines Landes. Aus seiner Sicht wissen Rezipierende um journalistische Normen und 
nehmen diese als Grundlage für die Bewertungen journalistischer oder medialer 
Leistungen. Diese Bewertungskriterien leitet der Autor aus Modellen der Öffent- 
lichkeitstheorien ab. So liefert er Annahmen über den Einfluss freier Presse auf 
die Vertrauenszuschreibungen oder kann mithilfe deliberativer Öffentlichkeitstheo- 
rien eine Bevorzugung der öffentlich-rechtlichen Medieninhalte im Vergleich zu 
denen privatwirtschaftlichen Organisationen darstellen (vgl. ebd.: 49-60, 61-89). 
Häufig wird in empirischen Studien zu Journalismusvertrauen auch auf die Arbeit 
von Hanitzsch et al. (2018) verwiesen, die ebenso dieser Forschungsperspektive 
zuzuordnen ist. Für die Autor:innen stehen kulturalistische und institutionale Erklä- 
rungen für Vertrauenszuschreibungen bei journalistischer Medien im Mittelpunkt. 
Sie nehmen an, dass politisches Vertrauen mit Vertrauen in journalistische Medien 


4 Vier von 15 relevanten Rezeptionsstudien erheben neben der Wahrnehmung auch die jewei- 
ligen Erwartungen. Zur Datenerhebung nutzen die Studien leicht unterschiedliche Vorgehens- 
weisen, siehe Ausführungen und Aufarbeitung der Studien in Kapitel 5. 

5 Folgearbeiten dazu ergänzen die aufgeführten Gründe zudem um politische Merkmale (vgl. 
Obermaier 2020: 90 f. mit Verweis auf Schultz et al. (2017) und Ziegele et al. (2018)). Vgl. 
dazu auch Abschnitt Bedingungen und Voraussetzungen für Medienvertrauen Abschnitt 4.4.1. 
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verbunden ist und verweisen auf den möglichen Einfluss von Medienskandalen und 
negativer Berichterstattung auf Vertrauen in journalistische Medien sowie auf große 
Unterschiede zwischen einzelnen politischen Systemen (vgl. ebd.: 4f.,9, 20-13). 
Außerdem gehen die Autor:innen auf den Einfluss extremer politischer Ideologie 
und politischer Polarisierung ein (vgl. Obermaier 2020: 91 f.). 

Insgesamt legt die Annahme, dass Vertrauen im Sinne eines Institutionenvertrau- 
ens der Lesenden zu behandeln ist, den Schwerpunkt der Forschungsarbeiten auf die 
Gründe und Einflussfaktoren von Vertrauensentscheidungen. Insbesondere auf der 
Mirkoebene wird so ein detaillierteres Verständnis für Vertrauensurteile erzielt. Die 
vorliegende Arbeit schließt sich dieser Auffassung an und sieht Perspektive b) als 
geeignete theoretische Grundlage dieser Studie an und berücksichtigt Perspektive 
a) im Zusammenhang mit einem Forschungsausblick auf Folgestudien. Die unter- 
schiedlichen Arbeiten und Schwerpunktsetzungen zu Vertrauen in journalistische 
Medien zeigen zudem deutlich, dass Vertrauen ein komplexes theoretisches Kon- 
strukt ist und die Liste an Einflussfaktoren und Bedingungen für Medien- und Jour- 
nalismusvertrauen weder als vollständig bearbeitet, noch als abgeschlossen gelten 
kann. So werden zum Beispiel seit dem Aufkommen von Online-Medien weitere 
Einflussfaktoren auf eine Vertrauenszuschreibung untersucht und ergänzt. Deut- 
lich wird, dass Forschung zu den Auswirkungen von Medienwandel beziehungs- 
weise Medieninnovationen notwendig ist, wie die zu möglichen Erweiterungen der 
Bedingungen, Einflussfaktoren und Konsequenzen für Vertrauenszuschreibungen 
in Journalismus als Ganzes. Weiterhin zeigen die Arbeiten zu Vertrauen in journa- 
listische Medien, dass monokausale Erklärungen für Journalismusvertrauen nicht 
aussagekräftig und in der Forschung konkret und differenziert formulierte Frage- 
stellungen notwendig sind, um gemäß wissenschaftlicher Gütekriterien Forschung 
zu betreiben und ihre Ergebnisse vergleichen und in der Folge sinnvoll einsetzen zu 
können. Angesprochen wurden zudem unterschiedliche Begriffsbestimmungen von 
Vertrauen in journalistische Medien beziehungsweise Journalismus, verschiedene 
Bezugsobjekte von Vertrauen sowie unterschiedlich verwendete Operationalisie- 
rungen und Forschungsmodelle. Der Notwendigkeit der Differenzierung wird im 
Abschnitt zur Aufarbeitung des Medienvertrauensbegriffs, seiner Operationalisie- 
rung sowie der Bedingungen und Voraussetzungen für Medienvertrauen in Bezug 
zum konkreten Forschungsanliegen dieser Arbeitin den Folgeabschnitten Rechnung 
getragen. 

Weitere Orientierung im heterogenen Forschungsfeld leistet Prochazka (2020), 
indem er die Medienbewertungsforschung in Perspektive b) (siehe oben) systema- 
tisiert und über eine Abgrenzungsdefinition herausarbeitet, was Vertrauensurteile — 
im Gegensatz zu Qualitäts- oder Glaubwürdigkeitsurteilen — beeinflusst. Prochazka 
(ebd.) bezieht sich auf die Vorarbeiten von Schweiger (2007: 247-253,257—261) 
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und stellt die Forschung zu Vertrauen in journalistische Medien zudem als c) Teil- 
gebiet des Forschungsbereichs der Medienbewertungen dar. In der Medienbewer- 
tungsforschung wird in Studien nach der Zufriedenheit, der Wahrnehmung oder der 
Bewertung des Publikums, bezogen auf die verschiedenen Aufgaben, Leistungen 
und Funktionen, die die Medien oder Journalismus erfüllen (sollen), gefragt. Im 
Grundsatz werden drei Bereiche unterschieden: erstens Studien zum Medienver- 
trauen beziehungsweise Misstrauen (z. B. Kohring und Matthes 2004; Prochazka 
und Schweiger 2018; Prochazka 2020; Obermaier 2020; Tsfati und Peri 2006), zwei- 
tens Arbeiten zur journalistischen Qualität (z. B. Voigt 2016; Molyneux und Cod- 
dington 2020) oder zu Performanzbewertung (z. B. Fawzi und Mothes 2020; Fawzi 
2020) sowie drittens Studien zur Glaubwürdigkeit der Medien (z. B. Appelman und 
Sundar 2016; Gaziano und McGrath 1986; Rössler und Wirth 1999). Die drei Teil- 
bereiche weisen sowohl empirisch als auch theoretisch starke Überschneidungen 
auf und werden nicht immer stringent getrennt, vielmehr werden deren jeweilige 
Begriffe teilweise synonym oder ihre Konzepte übergreifend verwendet: Es gibt 
zum Beispiel Studien, die Vertrauen in Medien über die Wahrnehmung von Quali- 
tät operationalisieren, in anderen wird die Qualitätswahrnehmung als Einflussfak- 
tor auf das zugesprochene Vertrauen konzipiert (vgl. Prochazka 2020: 34, 68) (vgl. 
auch Begriffsdefinition und Abgrenzung der Begriffe in Abschnitt 4.2.3.). Neben 
den begrifflichen und konzeptionellen Überschneidungen ist die exakte theoretische 
Fundierung und die valide Operationalisierung der Begriffe eine Schwierigkeit der 
Studienkonzeptionen: Es gibt zwar mehr oder weniger zuverlässige Kriterienkata- 
loge zu den Aufgaben und Leistungen von Journalismus, es gibt aber keine — und 
kann auch keine — objektiven Kriterien für etwa eine subjektiv wahrgenommene 
Qualität oder Vertrauen geben (vgl. z. B. Voigt 2016: 21f.). Konkret werden im 
Teilgebiet Medienvertrauen, dem für das vorliegende Forschungsinteresse wich- 
tigsten Bereich, Ansätze beschrieben, die „die Bewertung von Medien und [die] 
Einstellung gegenüber Medien unter dem Begriff des Vertrauens behandeln und 
sich dabei — mal mehr, mal weniger — theoretisch auf sozialwissenschaftliche Ver- 
trauenskonzepte beziehen“ (Prochazka 2020: 34). Medienvertrauen dient dem Autor 
als Sammelbegriff für sämtliche Arten von Vertrauen in Medien oder Mediengat- 
tungen. Er weist darauf hin, dass sich Medien als Begriff nicht auf journalistische 
Medien allein bezieht, wenngleich dies in der Regel der Fall ist (vgl. ebd.: 24). Pro- 
chazka (ebd.) liefert neben der Systematisierung einen Überblick über Konzepte und 
Begriffe und listet typische Forschungsfragen zum Medienvertrauen auf. Konkrete 
Fragen lauten beispielsweise ‚Wie sehr vertrauen Sie den Medien?‘. Der Digital 
News Report ermittelt die Zustimmung zur Aussage ‚Ich glaube, man kann dem 
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Großteil der Nachrichten meist vertrauen.‘ (Hölig et al. 2021: 24, vgl. insgesamt 
Prochazka 2020: 33-35). 

Hilfreich für die Systematisierung der Vertrauensforschung ist die Abgrenzung 
von Prochazka (ebd.) zur Wahrnehmung journalistischer Qualität und zur Glaub- 
würdigkeitsforschung in dem Sinne, dass typische Fragestellungen den drei Teil- 
bereichen zugeordnet und so strukturiert werden. Schwierig gestaltet sich gene- 
rell die Begriffsdefinition und die Abgrenzung der Teilbereiche untereinander (vgl. 
Abgrenzung Glaubwürdigkeit und Vertrauen in Abschnitt 4.2.3) sowie teilweise die 
Unterscheidung zwischen kommerzieller Mediaforschung und akademischer Ver- 
trauensforschung. Nicht-trennscharf werden in den Arbeiten zudem die Begriffe 
‚Journalismus‘ und ‚Medien‘ verwendet, der Bezug zu Vertrauensobjekten ist teil- 
weise nicht klar kommuniziert und die Abgrenzung beziehungsweise Abstufung von 
Vertrauen, Misstrauen, Medienkritik oder Medienskeptizismus ist in den deutschen 
und internationalen Veröffentlichungen nicht immer eindeutig beschrieben. Auf- 
grund dieser Ungenauigkeiten werden im folgenden Abschnitt die Grundlagen des 
Medienvertrauens dargestellt und es erfolgt eine detailliertere Auseinandersetzung 
mit relevanten Begriffen und Bezügen. 


4.2 Grundlagen des Begriffs Medienvertrauen 


Die wissenschaftliche Auseinandersetzung mit Vertrauen ist Gegenstand mehrerer 
Disziplinen, wobei die Grundlagen des Begriffs insbesondere in der Psychologie 
entwickelt und anschließend in mehreren Disziplinen, so auch in der Kommuni- 
kationswissenschaft, aufgegriffen und für fachspezifische Fragestellungen weiter- 
entwickelt wurden. Im Folgenden werden die wesentlichen Grundlagen und Cha- 
rakteristika des Vertrauensbegriffs — immer mit Blick auf kommunikationswissen- 
schaftliche Fragestellungen - dargestellt. Ziel ist es, einen offenen und explorativen 
Zugang zur Fragestellung und den wesentlichen Begriffen dieser Arbeit zu gewähr- 
leisten, aber gleichzeitig eine Vergleichbarkeit der bisherigen Forschungsarbeiten 
und die Anschlussfähigkeit der zu erzielenden Studienergebnisse im Fach sicher 
zustellen. Dazu werden zunächst die wesentlichen Bestandteile des allgemeinen 
Vertrauensbegriffs dargelegt, dann richtet sich der Blick auf Vertrauen in journalis- 
tische Medien und anschließend erfolgt eine Abgrenzung des Vertrauensbegriffs zu 
ähnlichen Konzepten, insbesondere zum Begriff der Glaubwürdigkeit. Die Ausfüh- 
rungen stellen die Grundlage für die Ableitung des generalisierten Medienvertrauens 


6 Die Operationalisierung von Vertrauen wird zudem in Abschnitt 4.3 thematisiert und die 
Ergebnisse des Digital News Reports im Abschnitt 4.5 ausgeführt. 
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als wesentlichem Begriff dieser Arbeit und als Basis der Operationalisierung von 
Medienvertrauen (vgl. Abschnitt 4.3) dar. 


4.2.1 Vertrauen im Allgemeinen 


In der Psychologie wird ‚Vertrauen‘ definiert als eine „mit positiven Zukunftser- 
wartungen verbundene Vorleistung des Vertrauensgebers [...], die persönliche Ver- 
letzbarkeit und das Eingehen indiv. oder kollektiver Risiken impliziert, da neg. 
Konsequenzen folgen können [Abkürzungen im Org.]“ (Clases 2021). Durch Ver- 
zicht auf Kontrolle erweitern sich Handlungsoptionen des Vertrauensgebers (vgl. 
auch Petermann 1999: 437f., Myers 2014: 199). Angesprochen wird bereits in 
dieser Definition, dass eine Vertrauensbeziehung aus mindestens zwei beteiligten 
Akteur:innen besteht. Dazu gehört die natürliche Person des oder der Vertrauens- 
geber:in, auch Vertrauenssubjekt (engl.: trustor) genannt, welcher oder welche das 
Vertrauen entgegenbringt. Dem gegenüber steht das Vertrauensobjekt, auch Ver- 
trauensnehmer genannt (engl.: trustee), dem Vertrauen (oder kein Vertrauen) zuge- 
sprochen wird (vgl. für die Kommunikationswissenschaft z. B. Steindl 2021: 36; 
Prochazka 2020: 39). Eine Vertrauensbeziehung zwischen zwei natürlichen Perso- 
nen, wie sie häufig Gegenstand der Psychologie ist, wird als interpersonelles oder 
interpersonales Vertrauen bezeichnet (vgl. Steindl 2021: 20). Thema der Kommu- 
nikationswissenschaft und insbesondere der Journalismusforschung sind hingegen 
meist generalisierte Vertrauensbeziehungen zwischen Individuen und abstrakten 
Bezugsobjekten. Die vorliegende Arbeit konzentriert sich auf Lesende als Vertrau- 
enssubjekte und etablierte Medien beziehungsweise ‚Journalismus als Ganzes‘ als 
Vertrauensobjekt. 

Um allgemeines Vertrauen als Grundlage für diese Arbeit systematisieren zu 
können, werden im Folgenden die wesentlichen Bestandteile von Vertrauen, die 
die Forschung bisher beschrieben hat, anhand dreier erkenntnisleitender Fragen 
thematisiert. Zunächst soll erfasst werden, was allgemeines Vertrauen bedeutet 
und kennzeichnet. Danach wird intensiver betrachtet, wie eine Vertrauensentschei- 
dung zu Stande kommt und von welchen Faktoren diese abhängig und geprägt ist. 
Abschließend wird erläutert, was die Folgen von Vertrauen oder Nicht-Vertrauen 
sind, beziehungsweise was Vertrauen bewirkt. Als Grundlage für die Erarbeitung 
unterschiedlicher Vertrauensbegriffe dient häufig die Definition nach Mayer et al. 
(1995), wonach Vertrauen als „the willingness of a trustor to be vulnerable to the 
actions of a trustee based on the expectation that the trustee will perform a par- 
ticular action, irrespective of the ability to monitor or control that other party 
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[Herv. i. Org.]“ (ebd.: 712) beschrieben wird. Auf Basis dieser Weiterentwicklung’ 
der oben genannten grundlegenden Definition aus der Psychologie können drei 
wesentliche Elemente des allgemeinen Vertrauens ausgeführt werden. Zunächst ist 
Vertrauen a) eine Vorleistung des Subjekts, sich „freiwillig, [...] aktiv [...] [und] 
trotz Alternativen“ (Steindl 2021: 37£.) einem Risiko auszusetzen und einen Kon- 
trollverzicht in Kauf zu nehmen. Mögliche Risiken, die das Vertrauenssubjekt in 
Kauf nimmt, sind Enttäuschungen, Verletzungen, Misserfolge oder Schäden, die 
aus Handlungen (oder Nicht-Handlungen) des Vertrauensobjekts entstehen (vgl. 
ebd.: 37f., 42). Damit ist Vertrauen b) eine mögliche Strategie des Vertrauens- 
subjekt mit einer ungewissen und nicht-kontrollierbaren Zukunft umzugehen und 
basiert auf einer optimistischen Erwartungshaltung gegenüber antizipierten künf- 
tigen Situationen (vgl. Steindl 2021: 36f.; Prochazka 2020: 39f.). Der Vertrau- 
ensgebende glaubt an die positiven Auswirkungen seiner oder ihrer Entscheidung 
für die Zukunft und zeigt „Zutrauen und [...] Zuversicht in die positiven Kon- 
sequenzen einer Vertrauensentscheidung [Herv. i. Org.]|“ (Steindl 2021: 36). Die 
Wertung, ob die Vertrauensentscheidung und damit das eingegangene Risiko und 
die optimistische Erwartungshaltung gerechtfertigt waren, kann das Subjekt immer 
erst im Nachgang treffen (vgl. ebd.: 42). Zudem ist Vertrauen c) „höchst evaluativ, 
da das Vertrauenssubjekt stets, sowohl bewusst als auch unbewusst, Bewertungen 
vornimmt“ (ebd.: 41). Ein Vertrauenssubjekt beurteilt die Situation, in der die Ver- 
trauensentscheidung gefällt wird oder die Beziehung zwischen ihm oder ihr und 
dem Vertrauensobjekt und/oder möglichen Dritten. Auch das Vertrauensobjekt an 
sich wird einer Bewertung unterzogen (vgl. Steindl 2021: 41 f.; Hardin 2006: 17 f.). 

Eine Vertrauensentscheidung kommt im Zusammenspiel zwischen individuellen 
Faktoren, die sich auf die Persönlichkeit des Vertrauenssubjekts beziehen, und Fak- 
toren, die sich aus der Situation und den Beziehungen der beteiligten Akteur:innen 
ergeben, zustande. Damit ein Vertrauensgebender einem Objekt erfolgreich Ver- 
trauen zusprechen oder ihm/ihr Vertrauen entwickeln kann, muss das Subjekt 
zunächst in seiner oder ihrer Persönlichkeit die Fähigkeit entwickeln, Vertrauen oder 
Empathie auszubilden. Diese grundlegende Fähigkeit wird auch als das so genannte 
Urvertrauen (engl.: ‘basic trust’) bezeichnet, das entscheidend in der frühen Sozia- 
lisationsphase in der Kindheit entwickelt und geprägt wird (vgl. Myers 2014: 199), 
wobei neuere Forschungsarbeiten auch Einschränkungen dieser monokausalen Prä- 
gung beschreibt (vgl. Steindl 2021: 60). Insgesamt ergibt sich eine individuelle 


7 Steindl (2021) entwickelt acht Merksätze zum allgemeinen Journalismus- und Medienver- 
trauen, auf die hier im Wesentlichen Bezug genommen wird. Die Autorin leitet eine detaillierte 
Aufarbeitung der bisherigen theoretischen und empirischen Arbeiten und schafft eine fun- 
dierte Grundlage des allgemeinen Vertrauensbegriffs für die Kommunikationswissenschaft. 
Weiterführend sei auf ihre umfangreiche Nennung von Primärliteratur hingewiesen. 
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Vertrauensneigung, die jede Vertrauensentscheidung des Subjekts beeinflusst. Ver- 
trauen hat, so beschreibt es Steindl (ebd.) weiter, stets affektiven Charakter, indem 
Vertrauensentscheidungen und die Entwicklung von Empathie mit den Emotionen 
und Gefühlen des Subjekts verbunden sind (vgl. ebd.: 40). Für eine Vertrauens- 
entscheidung sind weiterhin die Erwartungen und Erfahrungen des Vertrauenssub- 
jekts ausschlaggebend (vgl. Luhmann 2014: 31 ff.). Auch hier ist die individuelle 
Sozialisationsphase relevant, in der die Fähigkeit ausgebildet wird, Lernimpulse 
und Erfahrungen verarbeiten und bewerten zu können (vgl. Myers 2014: 199). Die 
Erwartungen der Vertrauenssubjekte in einer Vertrauenssituation „beziehen sich 
einerseits auf eine normative Ebene und auf die Wünsche und Hoffnungen [...], die 
mit den in der spezifischen Interaktion gezeigten und wahrnehmbaren vertrauens- 
relevanten Erwartungen des Objekts abgeglichen werden“ (Steindl 2021: 38). Die 
Erwartungen des Subjekts werden nicht nur durch bisher gemachte Erfahrungen in 
der jeweiligen Situation oder in der sozialen Interaktion mit dem bestimmten Ver- 
trauensobjekt ausgebildet, sondern entsteht auch aus vergleichbaren Interaktionen 
heraus und stabilisieren sich insgesamt über einem längeren Zeitraum. Vertrauen ist 
damit einerseits ein langfristiges, verallgemeinerndes und stabiles Konstrukt, das 
sich aus individuellen Charaktereigenschaften der Vertrauenssubjekte und ihren 
Erfahrungen mit einer Vielzahl von Beteiligten und Interaktionen ausbildet (vgl. 
Prochazka 2020: 43; Steindl 2021: 39). Andererseits prägen auch variable Aspekte 
eine Vertrauensentscheidung, da ein Vertrauensgebender „einem Objekt lediglich im 
Hinblick auf bestimmte Handlungen bzw. spezifischen Aufgaben in einer konkreten 
Situation vertrauen [wird]“ (Steindl 2021: 41). Diese veränderbaren Einflüsse ent- 
stehen durch die konkrete Situation der Vertrauensentscheidung und durch die Art 
und Qualität der Beziehung zwischen Vertrauenssubjekt und -objekt oder möglichen 
Dritten (vgl. ebd.: 40). 

Wie ausgeführt, werden Vertrauensentscheidungen auf der Grundlage individuel- 
ler Erfahrungen, Erwartungen und Wissensstände der Subjekte getroffen, beinhalten 
aber gleichzeitig immer fehlendes Wissen und begrenzte Informationen. Eine Ver- 
trauensentscheidung vollzieht sich damit unter unsicheren Bedingungen und Kon- 
sequenzen, die auf begrenzten Informationen beruht und unter Zuhilfenahme von 
Heuristiken gelöst wird. Damit Individuen handlungsfähig bleiben und die Lücke 
zwischen Wissen und Nicht-Wissen schließen können, ist Vertrauen essentiell (vgl. 
Fawzi und Mothes 2020: 2; Prochazka 2020: 40f.; Vanacker und Belmas 2009: 
112; Sundar 2008: 74f., 77). Dies gilt vor allem für Bereiche, in denen die Ver- 
trauensvorleistung des Subjekts nicht überprüft und verifiziert werden kann (vgl. 
Steindl 2021: 38). Demzufolge reduziert Vertrauen soziale Komplexität und bewirkt, 
dass Vertrauenssubjekte mit begrenzten Informationen auf die Zukunft gerichtete 
Entscheidungen treffen und Handlungsoptionen auswählen können (vgl. Luhmann 
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2014: 23f., 30ff., Hanitzsch et al. 2018: 4). Vertrauen ist deshalb die Grundlage 
für das Funktionieren komplexer Systeme wie beispielsweise Demokratien oder 
Mediensysteme. 

Die Charakteristika von Vertrauen, die Abhängigkeiten und Determinanten 
der Vertrauensentscheidung sowie die Wirkung von Vertrauen hat Steindl (2021) 
abschließend zusammengefasst und definiert Vertrauen als 


„Umfang, in dem sich das Vertrauenssubjekt bewusst vom Vertrauensobjekt abhängig 
macht, im Gefühl des Zutrauens und der Zuversicht, dass die Intentionen des Objekts 
wohlwollend sind und dessen Handeln bei zukünftigen Leistungen im gewohnten Kom- 
petenzbereich zufriedenstellend erbracht werden. Grundlage der Vertrauensentschei- 
dung sind persönliche Charakteristika und Prädispositionen, situative und relationale 
Faktoren, das Wissen über sowie die Evaluation des Objekts, die auf generalisierten 
und/oder spezifischen Erfahrungen basieren und mit den eigenen Erwartungen abge- 
glichen werden. Mit der Vertrauensentscheidung wird Optimismus verkörpert und in 
der Konsequenz das Handeln angepasst, da das Subjekt aktiv und freiwillig das Risiko 
eingeht, mitunter negative Konsequenzen davonzutragen |Herv. i. Org.]“ (ebd.: 43). 


Die ausführliche Definition beinhaltet die wesentlichen Komponenten des allgemei- 
nen Vertrauensbegriffs und stellt die Grundlage dieser Arbeit dar. Die Ausführlich- 
keit und Offenheit sind insbesondere für die Exploration eines Forschungsthemas 
wichtig, allerdings müssen an geeigneter Stelle Eingrenzungen vorgenommen wer- 
den, um eine Vergleichbarkeit der Studienergebnisse und eine Intersubjektivität der 
Erhebung zu gewährleisten und nicht unkonkret und vage zu verbleiben. Deshalb 
erfolgt in der Auseinandersetzung mit Vertrauen in journalistische Medien und den 
Grundsätzen der Operationalisierung sowie den, in der Forschung bisher themati- 
sierten Einflussfaktoren auf Medienvertrauen, die Konzentration auf den generali- 
sierten Vertrauensbegriff als zentrale Leitlinie der vorliegenden Arbeit. 


4.2.2 Vertrauen in journalistische Medien 


Die Grundlagen des allgemeinen Vertrauensbegriffs sind von der Kommunikations- 
wissenschaft aufgegriffen worden, um unter anderem das Vertrauen in journalisti- 
sche Akteur:innen oder journalistische Medien zu beschreiben und für fachspezifi- 
sche Fragestellungen zugänglich zu machen. Dabei konnte man sich bisher nicht auf 
eine allgemeingültige Definition zu Vertrauen in journalistische Medien verständi- 
gen — im Gegenteil, es sind eine Reihe Arbeiten mit ungenauer Begriffsbestimmung, 
unstrukturierten Konzepten und unterschiedlichen Bezugsobjekten publiziert wor- 
den (vgl. Fawzi, Steindl et al. 2021: 2). Um diese Schwierigkeit in der theoretischen 
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Fundierung der Vertrauensforschung aufzulösen, haben Fawzi, Steindl et al. (ebd.) 
eine umfassende Literaturanalyse durchgeführt und definieren auf dieser Grundlage 
Vertrauen in journalistische Medien als „the individual’s willingness to be vulne- 
rable to media objects, based on the expectation that they will perform a) satisfac- 
torily for the individual and/or b) according to the dominant norms and values in 
society (i.e. democratic media functions.) [Herv. i. Org.]|'“(ebd.: 3). Dabei, so die 
Autor:innen, ist diese Definition sowohl für die Analyse auf der Mikro- als auch auf 
der Makroebene gültig (vgl. ebd.: 3). 

In der Definition werden deutliche Bezüge zum allgemeinen Vertrauensbegriff 
(vgl. Abschnitt 4.2.1) deutlich, die hilfreich für die kommunikationswissenschaft- 
liche Forschung sind: Vertrauensentscheidungen des Publikums speisen sich neben 
individuellen Persönlichkeitsmerkmalen aus den bisherigen Erfahrungen des Publi- 
kums mit journalistischen Medien und den in der Gesellschaft geltenden Normen 
und Werte hinsichtlich der demokratischen Funktion von Medien und der Wahr- 
nehmung journalistischer Qualitätsmerkmale. Vertrauensentscheidungen bezogen 
auf journalistische Medien sind aktive Entscheidungen der Subjekte, die reflektiert 
und unter Berücksichtigung verschiedener Alternativen getroffen werden. Wenn 
Lesende journalistischen Medien ihr Vertrauen aussprechen, dann treffen sie diese 
Entscheidung unter Unsicherheit und mit begrenzten Informationen, obwohl sie die 
Leistungen und die positive Erfüllung des Vertrauensvorschusses, wenn überhaupt, 
nur schwer überprüfen können. Deshalb sind Vertrauensentscheidungen in Bezug 
auf journalistische Medien risikobehaftet, weil die Erwartungen auch unerfüllt wer- 
den können. Für demokratische Gesellschaften ist Medienvertrauen essentiell wich- 
tig zur Komplexitätsreduktion, zur Überbrückung von Wissen- und Nichtwissen 
sowie zur Legitimierung des journalistischen Systems und schlussendlich zur Legi- 
timierung der freiheitlich-demokratischen Grundordnung (vgl. Fawzi, Steindl et al. 
2021: 1ff.; vgl. van Dalen 2019: 356; Prochazka 2020: 42 f.; Obermaier 2020: 68 f., 
99f., Blöbaum 2020: 81). 

Neben den theoretischen Konzeptionen hat Prochazka (2020) in Leitfadeninter- 
views mit deutschen Online-Zeitungslesenden überprüft, ob es auch in der Empirie 
eine nachvollziehbare Vorstellung der Lesenden von Vertrauen in Journalismus gibt 
und ob diese zudem ein generalisiertes Vertrauensobjekt benennen können (vgl. 
ausführlich in Abschnitt 4.3.1). In der Studie konnten die Befragten sowohl inter- 
personelles Vertrauen als auch Vertrauen in journalistische Medien als Begriffe 
nennen und dazu jeweils wesentliche Konzeptionen formulieren und erläutern. Die 
Beschreibung des interpersonellen Vertrauens gelingt meist ohne wesentliche Pro- 
bleme und relativ intuitiv. Vertrauen bedeute „für die Befragten, sich willentlich 
und wissentlich gegenüber einer anderen Person einem gewissen Risiko auszu- 
setzen. Wenn sie Vertrauen haben, können sie dieses Risiko eingehen und gehen 
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davon aus, dass es keine negativen Konsequenzen nach sich zieht“ (ebd.: 137). 
Auch die Beschreibung von Vertrauen in journalistische Medien oder Journalismus 
ist den Befragten grundsätzlich möglich, fällt ihnen aber deutlich schwerer (vgl. 
ebd.: 138). Für sie ist „Vertrauen in Journalismus [...] eine abstrakte Einstellung, 
die sich darin äußert, dass Realitätsdarstellungen der Medien prinzipiell akzeptiert 
und für die eigene Meinungsbildung oder als Grundlage für politisches Engagement 
herangezogen werden können. Dieses Vertrauen ist [...] ein eigenes, übergeordnetes 
Konstrukt und getrennt von Qualitätswahrnehmungen zu begreifen. Die Befrag- 
ten verstehen es als eine generelle Haltung gegenüber den Mainstream-Medien, 
die von der Erfüllung bestimmter Qualitätserwartungen geprägt ist“ (ebd.: 138 f.). 
Außerdem wurden die Proband:innen in der genannten Studie sowohl zu ihrer Defi- 
nition von Journalismus als auch zum Verständnis von ‚etablierten Medien‘ befragt. 
Hier kann Prochazka (ebd.) zeigen, dass die Befragten ein „recht einheitliches und 
klar abgegrenztes Verständnis der etablierten Mainstream-Medien in Deutschland 
[haben], denen als ‚die Medien‘ ein generalisiertes Vertrauen bzw. Misstrauen ent- 
gegengebracht wird“ (ebd.: 136) (vgl. dazu auch Abschnitt 4.3.1.). Insgesamt wird 
deutlich, dass neben der theoretischen Konzeption von Vertrauen in Journalismus 
auch eine dazu passende und empirisch nachvollziehbare Vorstellung existiert sowie 
in der Empirie auch eine Vorstellung über das Vertrauensobjekt im generalisierten 
Journalismusvertrauen vorliegt und damit die theoretische Konzeption eine empiri- 
sche Entsprechung aufweist (vgl. ebd.: 137 ff.). 

An dieser Stelle sei außerdem auf die Grenzen der bisherigen Modellentwicklung 
der kommunikationswissenschaftlichen Vertrauensforschung hingewiesen. Neben 
dem häufig genannten Mangel an Längsschnittstudien, um beispielsweise eine Ver- 
trauensentwicklung oder -veränderung stärker nachvollziehen zu können (vgl. z.B. 
Fawzi, Steindl et al. 2021: 12£.), gibt es keine Modelle zur Entstehung oder Ver- 
änderung von Journalismusvertrauen im Zeitverlauf®. In der Psychologie dagegen 
werden zum Beispiel Arbeiten zur allgemeinen Vertrauensausbildung im Zeitver- 
lauf oder im Speziellen zur Vertrauenskalibrierung? mit automatisierten Systemen 
(vgl. Kraus 2020: 16) entwickelt. Diese Modelle sind durchaus auch auf weitere 


8 Grosser (2016) berücksichtigt in ihrem Modell zu Vertrauen in professionellen Online- 
Journalismus verschiedene Entwicklungsstufen, die sich aber auf den Umgang mit und Ver- 
änderungen in der Technologie beschränken und kein Prozessmodell darstellen. 


9 Vertrauenskalibrierung ist ein Begriff, der der Kommunikationswissenschaft fremd ist und 
im Fach nicht verwendet wird. Der Psychologe Johannes Kraus meint damit ein „angemes- 
senes Maß an Vertrauen in automatisierte Technologie [...] [als] wichtige Voraussetzung für 
eine effiziente und sichere Benutzung dieser Systeme“ (Kraus 2020: XIV). Er entwickelt ein 
dreistufiges Rahmenmodell zur Erforschung des Entwicklungs- und Kalibrierungsprozesses 
von Vertrauen in automatisierte Technologie. Dabei spielen die individuelle dispositionelle 
Vertrauensneigung (Stufe 1), eine Kombination aus Vertrauensneigung und Erwartungen an 


4.2 Grundlagen des Begriffs Medienvertrauen 61 


Disziplinen oder gesellschaftlich relevante autonom operierende Systeme übertrag- 
bar (vgl. ebd.: XTV). Eine Längsschnittstudie oder die Validierung eines Vertrauens- 
kalibrierungsmodells für den Umgang mit Automatisierungen im Journalismus wäre 
für die Kommunikationswissenschaft ein zielführendes und sehr wahrscheinlich 
gewinnbringendes Unterfangen, sprengt aber den Rahmen der vorliegenden Arbeit. 
Deshalb soll die hier geleistete Aufarbeitung der Vertrauensforschung zur automati- 
sierten Nachrichtenberichterstattung sowie die Exploration des Forschungsthemas 
die Grundlage für die weitere Modellentwicklung — auch für eine Vertrauensverän- 
derung oder -kalibrierung - darstellen. 


4.2.3 Vertrauen und Glaubwürdigkeit 


Bereits in der Einführung in die Vertrauensforschung ist deutlich geworden, dass 
es — in der Literatur und im alltäglichen Sprachgebrauch — eine Reihe ähnlicher 
und teilweise synonym verwendeter Konzepte zum Vertrauensbegriff gibt. Die, in 
der Medienvertrauensforschung am häufigsten genannten sind „confidence, credi- 
bility, scepticism, distrust and mistrust“(Fawzi, Steindl et al. 2021: 3). Die fol- 
genden Abschnitte thematisieren artverwandte Konzepte zu Vertrauen, um über die 
Abgrenzung zu einer abschließenden Schärfung des Vertrauensbegriffs beizutragen. 
Der Schwerpunkt liegt auf der Gegenüberstellung von Vertrauen und Glaubwür- 
digkeit, da Medienglaubwürdigkeit als Konstrukt dem bisherigen Forschungsstand 
zur Wahrnehmung computergenerierter Texte (vgl. Kapitel 5) zugrunde liegt und 
abschließend argumentiert werden muss, warum in dieser Arbeit der Vertrauensbe- 
griff bevorzugt wird. 


Zuversicht, Hoffnung und Glaube 

Zuversicht, Zutrauen, Hoffnung und Glaube sind Begriffe, die — vor allem empirisch 
— eng mit dem Vertrauenskonzept verbunden sind und auch in der theoretischen 
Konzeption der Begriffe Überschneidungen beinhalten. Zuversicht und Zutrauen 
fungieren als Gegenstücke zu Zweifel, wohingegen Hoffnung und Glaube Gegen- 
größen zu Resignation darstellen. Die theoretische Abgrenzung der vier Begriffe 
untereinander ist an dieser Stelle weniger relevant. Wichtig ist, dass allen vier Kon- 
zepten — im Gegensatz zu Vertrauen — eine Passivität zugrunde liegt und keine 
bewusste Handlung stattfindet. Im Kontrast dazu wird bei Vertrauen die bewusste 


das System (Stufe 2) sowie ein Feedbackprozess im Abgleich aus Systemerwartung und 
tatsächlichem Verhalten der Anwendung eine Rolle (vgl. ebd.: 34). 
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aktive Handlung unterstrichen, die ein Subjekt — unter Berücksichtigung mehrerer 
Alternativen — bei einer Vertrauensentscheidung eingeht (vgl. Steindl 2021: 31 f.). 

Für die Schärfung des in dieser Arbeit verwendeten Vertrauensbegriffs sind zwei 
weitere Aspekte wichtig. Erstens wird in der Abgrenzung von beispielsweise ‚Hoff- 
nung‘ und ‚Vertrauen‘, wie sie Prochazka (2020) vorgenommen hat, deutlich, wel- 
che negativen Konsequenzen eine zu Enttäuschung führende Vertrauensentschei- 
dung haben kann. Hoffnung bezieht sich auf „Ereignisse, die vom Akteur nicht 
beeinflusst werden können“ (Luhmann 2014: 29 zit. n. Prochazka 2020: 40). Ent- 
täuschtes Vertrauen sei so schwierig wiederherzustellen, weil sich „die bewusste 
Entscheidung [des Subjekts] für eine Alternative [...] als falsche Entscheidung her- 
ausgestellt [hat], die in Zukunft vermieden werden soll“ (ebd.: 40). Die negativen 
Konsequenzen einer Vertrauensentscheidung sind für die Exploration und Vertie- 
fung der bisherigen Erkenntnisse zu Vertrauen in automatisierten Journalismus für 
die vorliegende Arbeit — und zum aktuellen Einsatz des automatisierten Journa- 
lismus — weniger relevant, müssen aber in Folgestudien, insbesondere mit Blick 
auf eine Reflexion der Lesenden im längerfristigen Umgang mit automatisierter 
Berichterstattung und möglicher Enttäuschung untersucht werden. Zweitens sei der 
Vollständigkeit halber auf die Ausführungen einzelner Autor:innen hingewiesen, 
die argumentieren, dass Vertrauen in Institutionen als Vertrauensobjekte grundsätz- 
lich nicht möglich sei und damit auch kein Medienvertrauen vorliegen könne (vgl. 
Hardin 2006: 41 zit. n. Steindl 2021: 32). Aus Sicht von Hardin (2006) sei direkte 
Reziprozität, also eine Gegenseitigkeit im sozialen Austausch, zwischen individu- 
ellen Akteur:innen für Vertrauen zwingend notwendig, und diese fehle einer Insti- 
tution als abstrakter Entität. Daher können Menschen nur Zuversicht oder Zutrauen 
in Institutionen entwickeln, nicht aber Vertrauen oder Nicht-Vertrauen (vgl. ebd.: 
40f. und Levi 1998: 80 zit. n. Steindl 2021: 32). Diese Argumentation findet in der 
Literatur wenig Rückhalt (vgl. auch Fawzi, Steindl et al. 2021: 3): zum Beispiel 
argumentiert Steindl (2021), dass Menschen Institutionen sehr wohl menschliche 
Eigenschaften zuschreiben und zudem in der Theorie zwingend zwischen Zutrauen 
und Vertrauen unterschieden werden muss, um beispielsweise die genannte aktive 
Entscheidung einer Vertrauensentscheidung und ihrer Konsequenzen berücksich- 
tigen zu können (vgl. Steindl 2021: 33; Fawzi, Steindl et al. 2021: 3). Auch die 
vorliegende Arbeit folgt der Auffassung, dass ein institutioneller Vertrauensbegriff 
hinsichtlich des Vertrauensobjekts der Medien existiert und dieser für die vorlie- 
gende Arbeit angewendet werden muss. 


Misstrauen, Skepsis und Zynismus 
Misstrauen, Skepsis und Zynismus sind weitere Begriffe, die in der Medienbewer- 
tungsforschung teilweise überschneidend mit Vertrauen verwendet werden und sich 
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mit enttäuschtem, fehlendem oder negativem Vertrauen beschäftigen. Diese nega- 
tiven Auswirkungen sind, wie schon bei der Gegenüberstellung von Hoffnung und 
Vertrauen angesprochen, nicht Gegenstand der vorliegenden Arbeit, sondern kön- 
nen in Folgestudien thematisiert werden (vgl. auch Fawzi und Obermaier 2019; 
Blöbaum 2020). Gegenstand des empirischen Teils dieser Arbeit sind Menschen 
mit mittleren Vertrauensniveaus, um eine zielgerichtete Exploration und Vertie- 
fung bisheriger Ergebnisse leisten zu können. Zur Schärfung des Vertrauensbegriffs 
seien an dieser Stelle drei Abgrenzungen von Misstrauen, Skepsis und/oder Zynis- 
mus zu Vertrauen erwähnt: Der deutlichste Unterschied zu Vertrauen ist a) der 
fehlende Bezug von Misstrauen, Skepsis und Zynismus auf eine künftige Situation 
oder ein zukünftiges Ereignis, was für Vertrauen konstituierend ist. Weiterhin sei 
b) auf den wissenschaftlichen Diskurs zur Konzeption von Vertrauen und Miss- 
trauen hingewiesen: Einige Autor:innen setzen fehlendes Vertrauen mit Misstrauen 
gleich (vgl. Levi 1998: 77 ff.), andere sprechen von zwei gegensätzlichen Begrif- 
fen (vgl. Schoorman et al. 2007: 350) und wieder andere begreifen Vertrauen und 
Misstrauen als zwei eigenständige Konzepte (vgl. Luhmann 2014: 92; Kohring 
2008: 613-618, insgesamt nach Fawzi, Steindl et al. 2021: 82; Steindl 2021: 34 
f.; Blöbaum 2020: 82). Die Verfasserin der vorliegenden Arbeit schließt sich der 
dritten Konzeptualisierung an, versteht fehlendes Vertrauen als eine Ausprägung 
von Vertrauen und unterscheidet davon grundsätzlich Misstrauen als eigenständi- 
ges Konstrukt. Der Vollständigkeit halber sei noch auf Arbeiten hingewiesen, die 
c) zwischen Zynismus, Argwohn sowie ‘mistrust’ und ‘distrust’ unterscheiden und 
vor allem die unterschiedlichen Ausprägungen, Gründe und Konsequenzen fehlen- 
den Medienvertrauens besprechen. Die dazu relevanten Arbeiten haben Steindl (vgl. 
2021: 34f.) und Fawzi, Steindl et al. (2021: 3) systematisiert. 


Glaubwürdigkeit und Vertrauen 

In der Medienbewertungsforschung ist der Vertrauensbegriff eng mit dem Konzept 
der Glaubwürdigkeit (engl.: credibility) verbunden; beide werden häufig sowohl 
theoretisch als auch empirisch nicht trennscharf voneinander abgegrenzt (vgl. Dern- 
bach und M. Meyer 2005: 137 ff.; Prochazka und Schweiger 2018: 3; van Dalen 
2019: 357; Strömbäck et al. 2020: 3). Die Überschneidungen in der theoretischen 
Begriffsdefinition haben zum einen historische Gründe, da die Kommunikationswis- 
senschaft in den 1940er- und 1950er-Jahren zunächst die Medienglaubwürdigkeit 
im Blick hatte und sich daraus, hauptsächlich seit den 1990er-Jahren und erneut 
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ab 2010, die Vertrauensforschung entwickelt hat!°. Zum anderen haben die Über- 
schneidungen von Glaubwürdigkeit und Vertrauen konzeptionelle Gründe, die im 
Folgenden systematisiert und aufbereitet werden. Die Auseinandersetzung mit bei- 
den Konzepten ist wichtig, da der bisherige Forschungsstand zur Wahrnehmung 
computergenerierter Nachrichten (vgl. Kapitel 5) auf dem Glaubwürdigkeitskon- 
zept und seinen unterschiedlichen Operationalisierungen beruht, für die vorliegende 
Arbeit aber der Vertrauensbegriff vorgezogen wird. Die Begründung, warum Ver- 
trauen für das vorliegende Erkenntnisinteresse zielführender ist, erfolgt nach der 
Auseinandersetzung mit beiden Konzepten. 

Vertrauen und Glaubwürdigkeit werden in der Literatur in der Regel in drei 
beziehungsweise vier Arten zueinander in Beziehung gesetzt (vgl. van Dalen 2019: 
357 f.; Prochazka 2020: 38). Zum einen werden in Studien Glaubwürdigkeit und 
Vertrauen synonym verwendet (vgl. Fawzi, Steindl et al. 2021: 3), andere Autoren 
sehen Vertrauen als Grundlage für Glaubwürdigkeit an („we find informationen 
credible, if it comes from a trustworthy source“ (Hovland und Weiss 1951: 649 f. 
zit. n. van Dalen 2019: 357) und eine dritte Gruppe argumentiert, dass wiederum 
Glaubwürdigkeit die Grundlage für beziehungsweise ein Teilphänomen von Ver- 
trauen ist („we trust a source when its information time after time proofs to be 
credible“(Sobel 1985: 557, 570 f. sowie Bentele und Seidenglanz 2015: 412 zit. 
n. van Dalen 2019: 357)!!. Aus dieser Systematisierung heraus argumentieren van 
Dalen (ebd.) oder auch Prochazka (2020: 38 f.) für einen vierten Weg, indem Glaub- 
würdigkeit und Vertrauen als zwei unterschiedliche Konzepte aufgefasst und ope- 
rationalisiert werden, die aber — in der Theorie ebenso wie in der Empirie — durch 
eine Reihe überlappender Elemente gekennzeichnet sind. Die vorliegende Arbeit 
folgt der vierten Argumentation, da die Gegenüberstellung beider Konzepte zeigen 
wird, dass Glaubwürdigkeit und Vertrauen zwar eng verwandte Begriffe sind, der 
Vertrauensbegriff aber als Grundlage zur vertieften Analyse der Wahrnehmung des 
automatisierten Journalismus weiterführende Erkenntnisse leisten kann, die über 
die Glaubwürdigkeit hinausgehen. 

Glaubwürdigkeit wird als Eigenschaft definiert, „die Menschen, Institutionen 
oder deren kommunikativen Produkten (...) von jemandem (Rezipienten) in 
Bezug auf etwas (Ereignis, Sachverhalte etc.) zugeschrieben wird“ (Bentele und 


10 Zur Entwicklung der Medienglaubwürdigkeits- und Journalismusvertrauensforschung sei 
auf Dernbach (2005: 137-140), van Dalen (2019: 357-363) und Obermaier (2020: 64-67) 
verwiesen. 


11 Operationalisiert wird Glaubwürdigkeit in der Regel - aber nicht ausschließlich - durch die 
Erhebung „past or present evaluations“(Prochazka und Schweiger 2018: 28) und Vertrauen 
unter anderem als „expectation“(van Dalen 2019: 357). Die Operationalisierung wird aus- 
führlich im Anschluss an die theoretische Auseinandersetzung beider Begriffe thematisiert. 
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Seidenglanz 2015: 412) und meint „den Grad, mit dem Informationen eines Bezugs- 
objekts als wahr erachtet werden“ (Kohring 2001: 18 zit. n. Prochazka 2020: 38). 
Damit werden die engen Verknüpfungen zwischen Vertrauen und Glaubwürdigkeit 
und die Gemeinsamkeiten in der Begriffsbestimmung deutlich: Bei beiden Konzep- 
ten geht es um mindestens zwei Akteur:innen und sowohl Glaubwürdigkeit als auch 
Vertrauen kann sich nicht nur auf interpersonale, sondern auch auf institutionelle 
Objekte beziehen!?. Gemein ist beiden Konzepten zudem eine implizierte positive 
Erwartungshaltung. Bei ‚Vertrauen‘ erwartet das Subjekt ein positives zukünftiges 
Ereignis, und ‚Glaubwürdigkeit‘ schließt die positive Grundhaltung mit ein, dass 
die Aussagen des Objekts grundsätzlich als ‚richtig zu bewerten‘ sind!?. Außer- 
dem reduzieren sowohl Vertrauen als auch Glaubwürdigkeit soziale Komplexität 
und sind wichtig für die Handlungsfähigkeit von Individuen in gesellschaftlichen 
Strukturen. Als weitere Gemeinsamkeit ist relevant, dass sowohl Vertrauen als auch 
Glaubwürdigkeit keine feststehende und objektiv überprüfbare Eigenschaft, son- 
dern ein „Element einer mehrdimensionalen Relation“ (Bentele und Seidenglanz 
2015: 2) sind. 

Beide Konzepte unterscheiden sich bei der Konzeption des Bezugsobjekts und 
der Gestaltung der Beziehung zwischen Subjekt und Objekt sowie in den Zeit- 
bezügen und Perspektiven, die den Begriffen zugrunde liegen. Zunächst sind die 
Objekte, auf welche sich Glaubwürdigkeit bezieht, enger gefasst als Vertrauensob- 
jekte (vgl. Fawzi, Steindl et al. 2021: 3; Prochazka 2020: 38f.). Glaubwürdigkeit 
beinhaltet immer einen Bezug zu einem konkreten Gegenstand, im Medienkontext 
zum Beispiel auf eine Nachricht oder eine übermittelte Information. Medienglaub- 
würdigkeit wird demzufolge unterschieden in Nachrichten-, Quellen- und Medium- 
glaubwürdigkeit!*. Vertrauen hingegen funktioniert ohne einen Gegenstandsbezug, 
geht über die „Aussagen von AkteurInnen [...] [hinaus, und richtet sich] auch auf 
technische, instrumentale und problemlösungsbezogene Aspekte“ (Steindl 2021: 
33). Bezogen auf Journalismus und Medien spricht van Dalen (2019) deshalb von 
der Unterscheidung zwischen „trust in media as a whole“ (ebd.: 358) und „credibi- 
lity of information“ (vgl. ebd.: 358)!5. Das Vertrauenskonzept beinhaltet zudem eine 


2 Angesprochen wurde bereits die Auffassung einiger Autor:innen, dass der institutionelle 
Bezug nur der Glaubwürdigkeit vorbehalten sei. Die Verfasserin der vorliegenden Arbeit teilt 
diese Auffassung nicht. 

3 Die Public Relations grenzen in diesem Sinn das Konzept der Images vom Begriff der 
Glaubwürdigkeit ab. Images haben die angesprochene prinzipielle Bereitschaft, die Aussagen 
anderer als richtig zu bewerten, nicht (vgl. Bentele und Seidenglanz 2015: 412). 


* Zur ausführlichen Operationalisierung siehe folgender Abschnitt. 


3 Neben den enger gefassten Bezugsobjekten der Glaubwürdigkeit beschreibt van Dalen 
(2019) zusätzlich einen engeren Fokus, den Glaubwürdigkeit im Gegensatz zu Vertrauen hat. 
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Beziehungsdimension, die der Glaubwürdigkeit fehlt (vgl. Bentele und Seidenglanz 
2015: 412; Steindl 2021: 33). Das heißt, Vertrauen beruht auf einer intensiveren 
Beziehung zwischen Subjekt und Objekt. Zudem führt van Dalen (2019) unter- 
schiedliche ‘Frames’ oder Perspektiven auf, die mit Glaubwürdigkeit beziehungs- 
weise Vertrauen einhergehen: Glaubwürdigkeit ist die aktuelle Bewertung eines 
Gegenstands wohingegen Vertrauen ein breiteres, vorausschauendes Urteil mit Blick 
auf eine unsichere künftige Situation darstellt (im Englischen prägnant als ‘evalua- 
tion vs prediction’ (vgl. ebd.: 358)). Eine Vertrauensentscheidung hat außerdem 
affektiven Charakter, dieser unmittelbare Handlungsbezug ist für Glaubwürdigkeit 
nicht notwendig (vgl. Steindl 2021: 33; Obermaier 2020: 71-73). 

Medienglaubwürdigkeit wird unterteilt in die wahrgenommene Glaubwürdig- 
keit einer Nachricht (Nachrichten- oder Textglaubwürdigkeit, engl.: message oder 
texteredibility), einer Quelle (Quellenglaubwürdigkeit, engl.: source oder author 
credibility), sowie eines Mediums (Mediumglaubwürdigkeit, eng.: medium credi- 
bility) (vgl. Prochazka 2020: 36f.; Schweiger 2007: 260)'6. Im Forschungsstand 
zur Wahrnehmung computergenerierter Nachrichten in Kapitel 5 überwiegen die 
Messung der Text- und Quellenglaubwürdigkeit!”. 


Ersteres beziehe sich nur auf die wahrgenommene Richtigkeit von Informationen während 
sich Vertrauen auf die „expectation that the media will satisfactorily fulfill several societal 
tasks, one of which is providing truthful information“ (ebd.: 358) bezieht. Einerseits schärft 
der Autor mit dieser Argumentation die theoretische Schärfung beider Begriffe, andererseits 
benötigt diese Begriffsabgrenzung eine exakte Operationalisierung insbesondere der Glaub- 
würdigkeit, wie sie in Studien bisher so nicht umgesetzt worden ist (vgl. dazu auch Kapitel 
Forschungsstand 5). Wie im Folgenden gezeigt wird, gibt es eine Reihe unterschiedlicher 
Skalen zur Messung von Glaubwürdigkeit und Vertrauen, die bei der Glaubwürdigkeit neben 
der wahrgenommenen Richtigkeit von Informationen auch weitere Items erheben. Damit ist 
diese Abgrenzung von Glaubwürdigkeit und Vertrauen über einen engeren Fokus für das vor- 
liegende Interesse, die Aufarbeitung des Studienstands, wenig dienlich und soll lediglich zur 
theoretischen Abgrenzung beider Konzepte erwähnt sein. 


16 Die Glaubwürdigkeit des Textursprungs meint, wie glaubwürdig oder wie qualitativ hoch- 
wertig die Textquelle wahrgenommen wird, also die Information, dass der Text von einem 
Algorithmus oder von einem Menschen generiert wurde. Unterteilt wird die Quellenglaubwür- 
digkeit in der Regel in die Dimensionen Kompetenz und Vertrauenswürdigkeit (engl.: expert- 
ness und trustworthiness). Die wahrgenommene Kompetenz bezieht sich auf die Fähigkeit der 
Quelle, Informationen korrekt wiederzugeben, und die Vertrauenswürdigkeit bedeutet, dass 
„die Quelle die korrekten Informationen auch mitteilen will [Herv. i. Org.]“ (Schweiger 2007: 
260) zit. n. vgl. Prochazka 2020: 36). Die Textglaubwürdigkeit bezieht sich auf die Frage, als 
glaubwürdig der vorgelegte Text wahrgenommen wird (vgl. ebd.: 36ff.). Ausführlich wird 
die Operationalisierung von Vertrauen in Abschnitt 4.3 thematisiert. 

17 Lediglich zwei Studien berücksichtigen auch die Mediumglaubwürdigkeit als abhängige 
Variable; siehe Systematisierung der Studien in Abschnitt 5.2.2 beziehungsweise die voll- 
ständige Tabelle 9.3. 
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Wie in Kapitel 4 ausführlich dargestellt wird, hat die Kommunikationswissen- 
schaft bisher keinen Konsens über eine einheitliche Operationalisierung von Ver- 
trauen gefunden. Ähnlich verhält es sich in der Glaubwürdigkeitsforschung: Man 
ist sich nur einig darüber, dass Glaubwürdigkeit ein mehrdimensionales Konstrukt 
ist, nicht aber darüber, welche Dimensionen das Konzept umfasst. „Unterschied- 
liche Faktorenstrukturen sind [...] vor allem der willkürlichen Auswahl von Items 
geschuldet“ (Prochazka 2020: 38) und es fehlt eine theoretische Fundierung der 
Begriffe und valide Ableitung der Glaubwürdigkeitsdimensionen und ihrer Ope- 
rationalisierung (vgl. Prochazka 2020: 38; Schweiger 2007: 260 f.; Prochazka und 
Schweiger 2018: 4; Rühl 2005: 130f.). Häufig verwendete Skalen zur Messung 
der verschiedenen Dimensionen der Glaubwürdigkeit sind Gaziano und McGrath 
(1986), Newhagen und Nass (1989), Sundar (1999), Schweiger (1999), Kohring und 
Matthes (2007), Flanagin und Metzger (2008), Metzger et al. (2010), Joo Chung 
et al. (2010) und Appelman und Sundar (2016) und als Forschungsmodelle dienen 
zudem häufig Wirth (1999: 49 ff.) Sundar (2008). 

Auch die bisher veröffentlichten Rezeptionsstudien zur Wahrnehmung compu- 
tergenerierter Nachrichten in Kapitel 5 verwenden die Glaubwürdigkeit als abhän- 
gige Variable. In drei von 15 Publikationen wird Vertrauen als zusätzliche Varia- 
ble berücksichtigt (vgl. Van der Kaa und Krahmer 2014; Zheng et al. 2018; Liu 
und Wei 2019) und sechs weitere Arbeiten verwenden Vertrauen als Deskriptor 
der Glaubwürdigkeit (vgl. Tabelle 9.3 und ausführlich beschrieben Abschnitt ‚Ver- 
trauen und Vertrauenswürdigkeit‘ in Abschnitt 10). Insgesamt werden in den Online- 
Experimenten konkrete Textstimuli vorgelegt und in der anschließenden Befragung 
wird vor allem die wahrgenommene Quellen- und Textglaubwürdigkeit der Lesen- 
den erhoben (vgl. Kapitel 5). Abgesehen von der nicht-stringenten Verwendung 
einheitlicher Skalen zur Messung der Glaubwürdigkeit, die eine Vergleichbarkeit 
der Ergebnisse erschwert und die Aussagekraft der Daten verringert, ist die Ver- 
wendung des Glaubwürdigkeitsbegriffs für dieses Forschungsziel überzeugend: Die 
vorgelegten menschlich verfassten und computergenerierten Nachrichten sind ein 
unmittelbarer Gegenstandsbezug und bewertet wird die Wahrnehmung der vorgeleg- 
ten Texte und deren Kennzeichnung" ®. Die Verwendung des Medienglaubwürdig- 
keitsbegriffs ist deshalb passend. Für eine intensivere Reflexion der Wahrnehmung 
des automatisierten Journalismus, der Einflussfaktoren auf eine solche Bewertung 
sowie mögliche Konsequenzen der Einführung der Technologie auf die Perspektive 
der Lesenden greift der Glaubwürdigkeitsbegriff zu kurz. Deshalb wird in dieser 
Arbeit der Vertrauensbegriff mit dem konkreten Handlungsbezug, der Entscheidung 


18 Zusätzlich zur nicht-stringenten Operationalisierung kann man auch die Auswahl der Sti- 
muli kritisieren, dazu aber ausführlicher Abschnitt 6. 
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unter Unsicherheit mit Blick auf eine zukünftige Situation und die weiter gefasste 
Beziehung zwischen Subjekt und Objekt verwendet, welcher über die Medienglaub- 
würdigkeit hinausgeht. 


4.3 _ Operationalisierung von Medienvertrauen 


Im bereits angesprochenen Modell der ‘causes, object und consequences of media 
trust” haben Fawzi, Steindl et al. (2021), basierend auf einer umfassenden Litera- 
turanalyse, die Gründe, Einflussfaktoren und Bezugsobjekte für Medienvertrauen 
zusammengetragen. Grundlage des Modells ist die Verortung der relevanten For- 
schungsarbeiten in zwei konkurrierenden Theorien: In Arbeiten der cultural theo- 
ries wird argumentiert, dass sich Medienvertrauen aus interpersonalem Vertrauen 
ableiten lässt, welches sich in der frühen Sozialisation eines Menschen ausbildet. 
Im Sinne der institutionellen Theorien wird hingegen postuliert, dass sich Medi- 
envertrauen aus der (wahrgenommenen oder tatsächlichen) Leistung der Institu- 
tionen einer Gesellschaft entwickelt (vgl. van Dalen 2019: 357). Für beide Den- 
krichtungen arbeiten Fawzi, Steindl et al. (2021) Einflussfaktoren auf unterschied- 
liche Bezugsobjekte des Mediensystems heraus (vgl. auch Hanitzsch et al. 2018: 
4). Für den hier vorliegenden Forschungszweck werden insbesondere die sozia- 
len und medienrelevanten Einflussfaktoren der individuellen Ebene berücksichtigt 
(vgl. Forschungsmodell in Kapitel 6)! und gemäß des Erkenntnisinteresses der 
vorliegenden Arbeit werden im Schwerpunkt generalisierte Vertrauensbeziehungen 
thematisiert. Das Ziel der folgenden Operationalisierung von Medienvertrauen ist 
die Aufarbeitung der Umsetzung der Vertrauensbeziehungen, um eine Vergleich- 
barkeit von Studienergebnissen zu leisten sowie Forschungslücken zu identifizieren 
und die eigene empirische Erhebung vorzubereiten. 


19 Die Autor:innen gehen in der Analyse auch auf die Schwierigkeiten der Modellbildung ein, 
so spiegelt sich die bereits mehrfach angesprochene Komplexität des Vertrauensbegriffs der 
Kommunikationswissenschaft auch in der heterogenen Operationalisierung der bisherigen 
Studien zu Vertrauen wieder: Teilweise fehlt diesen die theoretische und empirische Klarheit 
der verwendeten Begriffe und Studienkonzeptionen, insbesondere was die Verwendung der 
Merkmale als abhängige, unabhängige Variablen oder Kontrollvariablen betrifft. Zudem wird 
die Mehrheit der Daten mittels Querschnittsdesigns erhoben und im Feld fehlen insgesamt 
Längsschnittstudien (vgl. Fawzi, Steindl et al. 2021: 12f.; Prochazka 2020: 273). 
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4.3.1 Vertrauensobjekte und generalisierte institutionalisierte 
Vertrauensbeziehungen 


Wie ausgeführt, ist Vertrauen definiert als interpersonale oder institutionelle Bezie- 
hung zwischen mindestens zwei Akteur:innen. Als Teil der Medienbewertungsfor- 
schung untersucht die Medienvertrauensforschung als Vertrauensgeber Leserinnen 
und Leser und Bezugsobjekte können sowohl interpersonale oder institutionalisierte 
Vertrauensobjekten sein??. Grundsätzlich ist eine Unterscheidung der verschiede- 
nen Vertrauensobjekte in der Theorie leistbar und wird im Folgenden thematisiert. 
Insbesondere in den empirischen, quantitativen Erhebungen zum allgemeinen Medi- 
envertrauen gibt es aber Schwierigkeiten in der Begriffsdifferenzierung: Hier ist in 
den Erhebungen und in den Datenauswertungen oft nicht klar, auf welches Objekt 
sich das gemessene Medienvertrauen bezieht, nach dem die Teilnehmenden in den 
Studien gefragt werden (vgl. Blöbaum 2020: 81; Jarren 2020: 163). 

Interpersonale oder interpersonelle?! Vertrauensverhältnisse sind Beziehungen, 
bei denen die beteiligten Akteur:innen Individuen sind, und die häufig in der Psy- 
chologie bearbeitet werden. Die psychologischen Arbeiten zu interpersonalen Ver- 
trauensbeziehungen dienen der Kommunikationswissenschaft als Grundlage für die 
Erarbeitung des Konzepts von Medienvertrauen. Institutionelle Vertrauensbeziehun- 
gen entstehen zwischen Individuen und gesellschaftlichen Institutionen; dabei wird 
der interpersonale Vertrauensbegriff auf Vertrauensobjekte wie Politik, Wirtschaft, 
Justiz, Polizei oder auch Medien und Journalismus übertragen (vgl. Prochazka 2020: 
42; Hoyer und Mønness 2016: 152; PytlikZillig et al. 2016: 111). 

In der Kommunikationswissenschaft werden interpersonale Vertrauensbezie- 
hungen selten untersucht, da sie sich auf den persönlichen Kontakt zwischen 
Akteur:innen beziehen (vgl. Prochazka 2020: 42) und diese Beziehungen im Fach 
kaum vorhanden sind. Untersucht wird beispielsweise, wie sehr Nachrichtenkonsu- 
ment:innen einzelnen Journalist:innen vertrauen. Häufiger thematisiert werden insti- 
tutionalisierte Vertrauensbeziehungen, also solche zwischen Lesenden und einem 
institutionalisierten Akteur wie beispielsweise Mediengattungen und Medienorga- 
nisationen, aber auch zu beruflichen Rollen oder dem System Journalismus als 
Ganzes (vgl. Fawzi, Steindl et al. 2021: 4). 

Institutionalisierte Vertrauensbeziehungen werden unterschieden in spezifische 
und generalisierte Formen: Es gibt Beziehungen, bei denen sich das Vertrauen 
der Lesenden auf einzelne Vertrauensobjekte richtet, was als spezifisches 


20 Medien fungieren als Vertrauensgüter mit der Besonderheit, dass die Qualität der Güter für 
Lesende kaum überprüfbar ist (vgl. Prochazka 2020: 11). 


21 Interpersonale und interpersonelle Vertrauensbeziehungen werden synonym verwendet. 
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Medienvertrauen bezeichnet wird””. Beispielsweise zählt dazu das Vertrauen in 
bestimmte Medienmarken oder das Vertrauen, das sich auf bestimmte Medienin- 
halte richtet. Generalisiertes Medienvertrauen meint hingegen Vertrauensbeziehun- 
gen, bei denen sich das Vertrauen der Vertrauensgeber:innen auf ein abstraktes 
Objekt bezieht. Generalisiertes Vertrauen ist losgelöst von konkreten Vertrauensob- 
jekten oder spezifischen Situationen und besteht in einer „general attitude towards 
others“ (ebd.: 4). Das Vertrauen in das System Journalismus als Ganzes oder das 
allgemeine Vertrauen in etablierte Medien ist zum Beispiel eine Form des genera- 
lisierten Medienvertrauens. In empirischen Erhebungen wird häufig nach Vertrau- 
enszuschreibungen gefragt, bei denen „in der Regel explizit oder implizit etablierte, 
journalistische Mainstream-Medien gemeint sind“ (Prochazka 2020: 44). 

Auch bei der vorliegenden Arbeit steht eine institutionalisierte Vertrauensbezie- 
hung zwischen Lesenden und dem System Journalismus als Ganzes im Mittelpunkt. 
Es geht um ein generalisiertes Vertrauen, welches Rezipient:innen dem Journalis- 
mus beziehungsweise dem automatisierten Journalismus entgegenbringen. Dieses 
generalisierte Medienvertrauen bezieht sich auf einen „abstrakten Kollektivbegriff 
für etablierte Medien und weniger auf konkret genutzte und verfügbare Einzelme- 
dien“ (Jackob, Schultz et al. 2017: 122). Prochazka (2020) kann zeigen, dass die 
theoretische Begriffsableitung des generalisierten Journalismusvertrauens auch in 
der Empirie Bestand hat. Zwar unterscheiden sich die unter den Befragten geäu- 
Berten Definitionen von Journalismus, insbesondere unter Medienskeptiker:innen, 
aber deutsche (Online-)Leser:innen haben ein „relativ klar abgegrenztes Bild eta- 
blierter journalistischer Mainstream-Medien im Kopf“ (ebd.: 265). Zudem benen- 
nen die Befragten die etablierten Medien zuverlässig als Vertrauensobjekt, wenn 
es um generalisiertes Journalismusvertrauen geht (vgl. ebd.: 136), und „bringen 
diesem abstrakten Bezugsobjekt ein generalisiertes Vertrauen entgegen und sind in 
der Lage, Erwartungen an den Journalismus als solches ebenso zu formulieren wie 
grundsätzliche Einschätzungen zu seiner Qualität zu geben“ (ebd.: 256). 


4.3.2 Umsetzung der Vertrauensfrage 
Die Frage nach dem Medien- beziehungsweise Journalismusvertrauen der Lesenden 


wird in der Literatur in zwei Hauptvarianten umgesetzt: erstens über die Abfrage 
einzelner Qualitätsmerkmale und zweitens als Globalabfrage des Vertrauens. Beide 


22 In der Literaturanalyse von Fawzi, Steindl et al. (2021) findet sich eine Darstellung der 
unterschiedlichen Arbeiten zu den Bezugsobjekten des Medienvertrauens mit umfassenden 
Primärquellen (vgl. ebd.: 4). 
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Varianten der Vertrauensabfrage weisen sowohl Stärken als auch Einschränkungen 
auf, die ausführlicher in Verbindung mit weiteren Schwierigkeiten der Operationa- 
lisierung thematisiert werden”. 

In Variante Eins wird Vertrauen als Index aus verschiedenen Indikatoren zur 
journalistischen Qualität umgesetzt. Dabei wird in den bisherigen Studien nicht eine 
Skala mehrfach verwendet, sondern häufig Skalen aus verschiedenen Items gebil- 
det. Die zugrundeliegende Annahme dieses Vorgehens ist, dass die wahrgenommene 
Einhaltung verschiedener Qualitätsmerkmale im Journalismus einen Indikator für 
das Journalismusvertrauen der Lesenden darstellt. Das Vorgehen orientiert sich an 
den verschiedenen Skalen zur Messung von Quellen- und Medienglaubwürdig- 
keit, die in der Medienglaubwürdigkeitsforschung im Einsatz sind. Verwendet wird 
diese Umsetzung der Vertrauensfrage sowohl bei spezifischen Medien als auch zur 
Abfrage eines generalisierten Medienvertrauens. Als Beispiel für die Umsetzung der 
Qualitätswahrnehmung zur Vertrauenserhebung in Bezug auf spezifische Medien 
nennen Rössler (2011) und Prochazka (2020) die Arbeiten von Kohring (2004) und 
Kohring und Matthes (2004, 2007, 2012). Insgesamt überzeugt Kohring (2004), 
indem er „als einziger in der Literatur zu Vertrauen eine umfassende theoretische 
Basis für die Auswahl der Items [liefert] und [...] so eine stringent hergeleitete Skala 
vorlegen [kann]“ (Prochazka 2020: 50). Allerdings, und das ist die Einschränkung, 
bezieht sich die Messung auf einzelne Medienmarken oder Medienangebote, wel- 
che die Befragten häufig verwenden. Damit kann die Skala nicht für generalisiertes 
Journalismusvertrauen verwendet werden, sondern bezieht sich auf „die Bericht- 
erstattung eines Mediums zu einem Thema [Herv. i. Org.]“ (ebd.: 50). Daneben 
gelten die Arbeiten von Tsfati und Peri (2006) als Beispiel für die Abfrage von 
Qualitätswahrnehmungen in Bezug auf ein generalisiertes Vertrauensobjekt. Die 
Autoren prüfen den Zusammenhang zwischen Medienskepsis und dem Konsum 
von Mainstream- und Alternativmedien. Die Konzeption von Medienskepsis bauen 
sie auf einem generalisiertem Vertrauensbegriff auf und operationalisieren die Ver- 
trauensfrage mit fünf Items (vgl. ebd.: 171, 175). Sie nutzen die News Credibility 
Skala von Gaziano und McGrath (1986) mit den Ergänzungen von P. Meyer (1988) 
und erheben die Items ‘fair, accurate, unbiasd, tell the whole story, can be trusted’ 
(vgl. Tsfati und Peri 2006: 175). 

Als zweite Variante wird die Vertrauensabfrage als Globalabfrage des Vertrauens 
verwendet. Hier wird in der Regel mit nur einem Item das Ausmaß von Vertrauen 


23 Die Ausführungen basieren auf Prochazka (2020), der den Forschungsstand nach der Ope- 
rationalisierung der Forschungsfrage und der jeweiligen Vertrauensobjekte ordnet und so vier 
Forschungsansätze identifiziert (vgl. ebd.: 45). Dabei bezieht er sich unter anderem auf die 
Zusammenfassungen von Schielicke et al. (2014: 249), Jackob, Schultz et al. (2017: 121 f.) 
und Prochazka und Schweiger (2018: 3). 
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abgefragt, zum Beispiel mit der Frage ‚Wie sehr vertrauen Sie den Medien im All- 
gemeinen?‘ (vgl. Prochazka 2020: 45,168). Die Globalabfrage wird auch intuitive 
Frage genannt. Die Vorteile dieser Abfrage liegen in der Schnelligkeit der Ergeb- 
nisse und dem geringen Aufwand für die Befragten: „Im Idealfall provoziert die 
direkte Frage eine intuitive Reaktion, die das Vertrauenskonstrukt relativ gut abbil- 
det“ (ebd.: 50). Die Einfachheit der Abfrage ist aber gleichzeitig ein Nachteil der 
Erhebung, so wird über die Messgenauigkeit und Validität der Ergebnisse diskutiert 
(vgl. Prochazka 2020: 50; Kohring und Matthes 2004: 196f.). Konkret umgesetzt 
wird das Vorgehen häufig durch die Nennung einer Prozentangabe des Vertrauens, 
mittels Schieberegler oder einer Likertskala (vgl. auch Strömbäck et al. 2020: 5£.). 
Als Beispiele für die Umsetzung der Globalfrage eines spezifischen Vertrauensob- 
jekts gelten die deskriptiven Erhebungen, die in Kapitel 5 dargestellt werden. Mit 
einem generalisierten Vertrauensobjekt und einer Globalabfrage arbeiten beispiels- 
weise Studien zum Vertrauen in etablierte Medien (vgl. Prochazka 2020: 45). 

Für seine Erhebung nutzt Prochazka (ebd.) die direkte Globalabfrage und ent- 
wickelt diese zusätzlich weiter und misst generalisiertes Vertrauen „darüber [...] ob 
die Befragten sich bei ihrer Meinungsbildung und in der Anschlusskommunikation 
auf journalistische Medien verlassen“ (ebd.: 270). Dazu bildet er, abgeleitet aus der 
Theorie und den Ergebnissen der qualitativen Interviews, für die quantitative Befra- 
gung einen Index aus fünf Items zur Messung des generalisierten Vertrauens?*. Er 
nennt es instrumentelle Abfrage des Vertrauens und berücksichtigt werden soll „vor 
allem das Risiko [das Rezipient:innen in Bezug auf journalistische Medien] einge- 
hen, falsche Entscheidungen auf Basis der dortigen Informationen zu treffen und 
dass sie riskieren, sozial isoliert zu werden“ (ebd.: 186). Damit wird unter anderem 
das Merkmal von Vertrauen berücksichtigt, dass sich Vertrauensentscheidungen auf 
die Zukunft richten und unter Unsicherheiten getroffen werden (vgl. dazu Begriffe 
und Schwierigkeiten der Operationalisierung in Abschnitt 4.3.3.). Die Messung von 
Vertrauen über eine Abfrage mehrere Items und die Berücksichtigung der theore- 
tischen Spezifika des Begriffs scheinen „[t]heoretisch [...] vielversprechend, insbe- 
sondere für eine Konsolidierung der Forschung zu Vertrauen in Journalismus, die 
sich bislang eher zögerlich systematisch mit dem zugrundeliegenden Verständnis 
von Vertrauen auseinandergesetzt hat“ (ebd.: 270). Dennoch zeigt auch die instru- 


24 Die fünf Items lauten: „Wenn ich mit anderen Menschen spreche, vertrete ich Sichtweisen 
aus den etablierten Medien“, „Was ich aus den etablierten Medien über aktuelle Ereignisse 
weiß, verwende ich in Gesprächen mit Freunden und Bekannten“, „Wenn ich jemanden von 
etwas überzeugen will, verwende ich Argumente, die ich aus den etablierten Medien habe“, 
„Wichtige Entscheidungen kann ich auf der Grundlage von Informationen aus den etablierten 
Medien treffen“, „Wenn ich mir eine fundierte Meinung bilden will, dann kann ich das auf 
der Grundlage von Informationen aus den etablierten Medien tun“ (Prochazka 2020: 168 f.). 
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mentelle Abfrage von Vertrauen Schwierigkeiten in der Operationalisierung auf, die 
im Folgeabschnitt thematisiert werden (vgl. ebd.: 220, 235, 270). 


4.3.3 Schwierigkeiten der Operationalisierung 


Die Komplexität der Theorieentwicklung und des empirischen Vorgehens in der 
Vertrauensforschung wurden mehrfach erwähnt. Diese Einschränkungen beeinflus- 
sen auch das Studiendesign der vorliegenden Arbeit, daher werden die Argumente 
und Konsequenzen, die sich aus der Operationalisierung ergeben, im Folgenden 
kurz zusammengefasst. Im Kern geht es um die Frage, ob und wie es theoretisch 
und empirisch möglich ist, ein eindeutiges und abgegrenztes Begriffsverständnis 
von generalisiertem Vertrauen herzustellen, und darum, wie dieses in der Operatio- 
nalisierung umzusetzen ist. 

Prochazka (ebd.) führt die Schwierigkeiten der Operationalisierung des Journa- 
lismusvertrauen in Bezug auf den generalisierten Vertrauensbegriff und die Ein- 
schränkungen in der jeweiligen Art der Umsetzung der Vertrauensfrage sowie 
mögliche Lösungen bereits auf (vgl. Prochazka 2020: 46, 50ff., 109; vgl. auch 
van Dalen 2019: 365 ff.). Er benennt zunächst drei Herausforderungen und For- 
schungslücken bei der Definition des generalisierten Journalismusvertrauens, die er 
anschließend mit einer empirischen Erhebung bearbeitet. Dabei beschreibt er ers- 
tens die Schwierigkeit, eine theoretisch fundierte und saubere Begriffsbestimmung 
dessen vorzunehmen, was unter generalisiertem Vertrauen beziehungsweise Ver- 
trauen in etablierte Medien zu verstehen ist. Zweitens erläutert er die Probleme bei 
der Bestimmung des Begriffs in der Empirie und beschreibt das fehlende Wissen 
der Kommunikationswissenschaft darüber, ob die Bevölkerung ein derart eindeu- 
tiges Verständnis ‚der etablierten Medien‘ hat und die theoretische Ausarbeitung 
des Begriffs in der Empirie nachvollzogen werden kann. Zudem geht er drittens auf 
die Frage ein, ob ein generalisierter Vertrauensbegriff überhaupt valide ist, oder ob 
die Lesenden nicht beispielsweise zwischen einzelnen Mediengattungen oder auf 
der Individualebene derart viele Unterschiede in der Bewertung der Medien tref- 
fen, dass man nicht von einer generalisierten Einstellung den Medien gegenüber 
sprechen kann (vgl. Prochazka 2020: 50ff.). 

Dazu argumentiert Prochazka (2020) zunächst, dass der Begriff des ‚medialen 
Mainstreams‘ Mainstreams, auf den sich generalisiertes Medienvertrauen bezieht, 
in den letzten Jahren durchaus Einzug in die wissenschaftliche Auseinanderset- 
zung gehalten hat und man sich auf wesentliche Begriffe einigen konnte. Mit 
medialem Mainstream ist „eine abstrakte[...] mentale[...] Repräsentation“ (Jackob, 
Schultz et al. 2017: 229) von Nachrichtenmedien gemeint, die von der Mehrheit der 
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Gesellschaft genutzt und von der Bevölkerung dem Mainstream zugerechnet wer- 
den. Die Struktur und der Inhalt der Programme sind überwiegend auf die Mitte 
der Gesellschaft und den Mehrheitsgeschmack ausgerichtet. Zum medialen Main- 
stream der deutschen Gesellschaft gehören „die großen, bekannten und reichwei- 
tenstarken Medienmarken wie die öffentlich-rechtlichen und privaten Rundfunk- 
sender, noch immer Tageszeitungen (trotz sinkender Auflagen), Wochenzeitungen 
sowie die jeweiligen Online-Portale dieser Anbieter“ (Prochazka 2020: 47). Damit 
ist eine hinreichend solide Grundlage für die theoretische Abgrenzung des Begriffs 
vorhanden, wenngleich deutlich wird, dass immer noch ein „nicht klar abzugren- 
zendelr] Bereich innerhalb der Vielfalt an (journalistischen) Medien“ (ebd.: 47) 
existiert. Neben der theoretischen Auseinandersetzung mit dem Begriff der etablier- 
ten Medien als Vertrauensobjekt ist für die Operationalisierung des generalisierten 
Medienvertrauens relevant, was Lesende in der Empirie unter ‚den Medien‘ verste- 
hen, ob sie ein einheitliches Bild etablierter Medien haben und welche Medien sie 
dem Mainstream zuordnen (vgl. Prochazka und Schweiger 2018: 14). Die empiri- 
schen Studienergebnisse zeigen, ähnlich zur Auseinandersetzung mit den Begriffen 
auf theoretischer Ebene, dass die Rezipient:innen eine einheitliche Vorstellung von 
etablierten Medien haben. Allerdings gilt auch hier, dass die exakte Zuordnung, 
welche Medien konkret dem Mainstream zugeordnet werden nicht immer trenn- 
scharf realisiert werden kann (vgl. Prochazka 2020: 136, 265). Es gibt insgesamt 
sowohl in der Theorie als auch in der Empirie eine hinreichend genaue Vorstellung 
über die etablierten Medien als Bezugsobjekt für generalisiertes Medienvertrauen. 

Für die Operationalisierung des generalisierten Journalismusvertrauens ist wei- 
terhin relevant, ob die Rezipient:innen — neben einer einheitlichen Vorstellung vom 
Vertrauensobjekt der etablierten Medien — auch ein generelles Vertrauen in Medien 
an sich haben. Gibt es eine solche allgemeine Vertrauenszuschreibung oder dif- 
ferenzieren die Lesenden in ihren Zuschreibungen derart, dass nicht von einem 
allgemeinen Vertrauen gesprochen werden kann? Aus bisherigen Untersuchungen 
ist bekannt, dass sich die Vertrauenswerte je nach Mediengattung unterscheiden und 
auch der Abstraktionsgrad im Vertrauensobjekt eine Rolle spielt. Konkrete Sendun- 
gen werden mit einem höheren Vertrauen bewertet als Medien im Allgemeinen (vgl. 
z. B. Blöbaum 2018: 606; Prochazka 2020: 48, 136). Gleiches gilt auch für Medien, 
die die Befragten jeweils selbst nutzen im Vergleich zu Medienangeboten, die sie 
dem Mainstream zuschreiben, aber nicht selbst konsumieren (vgl. Fawzi, Steindl 
et al. 2021: 8ff.). Damit gibt es zwar differenzierte Vertrauensurteile, insgesamt 
aber sind die spezifischen Vertrauenszuschreibungen und das allgemeine Medien- 
vertrauen eng verbunden. Demzufolge gibt es ausreichend empirische Hinweise, 
dass Rezpierende „eine generalisierte Einstellung zu journalistischen Medien ‚im 
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Großen und Ganzen‘ besitzen“ (Prochazka 2020: 48), wenngleich zusätzliche Stu- 
dien zum Thema notwendig sind (vgl. ebd.: 49). 

Weitere zu berücksichtigende Konsequenzen für die Operationalisierung des 
generalisierten Vertrauens in Journalismus ergeben sich aus der Umsetzung der Ver- 
trauensfrage als Globalabfrage oder als Abfrage der wahrgenommenen Einhaltung 
ausgewählter Qualitätsmerkmale als Indikatoren von Vertrauen”°. Die Globalab- 
frage von generalisiertem Journalismusvertrauen besticht durch die Einfachheit und 
die Generierung möglichst intuitiver Antworten (ausführlicher in Abschnitt 4.3.2.). 
Allerdings ist eine rein intuitive Messung von Vertrauen mit einem Item hinsichtlich 
ihrer Aussagekraft eingeschränkt: Unklar bleibt beispielsweise, was die Befragten 
jeweils unter ‚Vertrauen‘ verstehen. Es werden höchst subjektive Vorstellungen und 
unterschiedliche Vertrauenskonzepte gemessen. Insbesondere die Aussagekraft der 
mittleren Werte ist begrenzt: Es kann mit den Ergebnissen aus der Globalabfrage 
nicht unterschieden werden, ob die Befragten ein mittleres Vertrauen gegenüber 
Journalismus angeben, weil sie eine kritische und reflektierte Haltung gegenüber 
Journalismus haben oder weil Vertrauen in Journalismus für sie „überhaupt keine 
Kategorie ist bzw. [sie] vom medialen und politischen Tagesgeschehen aus unter- 
schiedlichen Gründen abgekoppelt sind“ (ebd.: 269). Zudem bringen Messungen 
einer quantitativen Erhebung mit nur einem Item immer die Schwierigkeit mit sich, 
dass etwaige Messfehler möglichst zu kontrollieren sind. Zudem können komplexe 
Begriffe, wie es Vertrauen einer ist, in der Regel mit mehreren Items präziser gemes- 
sen werden. 

Auch die Umsetzung der Vertrauensabfrage über die wahrgenommene Einhal- 
tung ausgewählter Qualitätsmerkmale birgt Einschränkungen, die bei der Konzep- 
tion von Studiendesigns und in der Interpretation der Ergebnisse berücksichtigt wer- 
den müssen. Zunächst müssen die Validität und Reliabilität der verwendeten Skalen 
überprüft werden. Die Auswahl und Zusammenstellung der Items mit den abgefrag- 
ten Qualitätsmerkmalen beruht vielfach auf Arbeiten aus der Medienglaubwürdig- 
keitsforschung. Als Grundlage dient meist die Skala von Gaziano und McGrath 
(1986), woraus häufig verschiedene und unterschiedlich viele Items für die Opera- 
tionalisierung des Vertrauens verwendet werden. Insbesondere an der Auswahl der 
Items, und Verwendung der Skalen und vor allem der Begründung der verwende- 
ten Items zur Messung der Glaubwürdigkeit beziehungsweise des Vertrauens gibt es 
Kritik. So werden, mit Ausnahme der Arbeiten von Kohring und Matthes (2004), die 
Items „in den meisten Fällen recht willkürlich ausgewählt und nur selten theoretisch 
begründet“ (Prochazka 2020: 50). Die Skala von Kohring und Matthes (2004) ist für 


25 Diese sind kurz im Abschnitt zur Umsetzung der Vertrauensfrage angesprochen worden 
und sollen an dieser Stelle die Schwierigkeiten der Operationalisierung abschließen. 
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die Messung von generalisiertem Journalismusvertrauen wiederum nicht geeignet, 
da sich die Messung auf die „Berichterstattung eines Mediums zu einem Thema 
bezieht [Herv. i. Org.]“ (Prochazka 2020: 50). Außerdem führt Prochazka (ebd.) die 
Überlegungen zur Skalenbildung weiter und weist darauf hin, dass es möglicher- 
weise generell unmöglich ist, eine abschließende Skala von Journalismusvertrauen 
über die Abfrage verschiedener Qualitätsmerkmale zu generieren. Journalistische 
Qualitätsmerkmale sind höchst subjektiv, in der Gesellschaft kann sich die Wich- 
tigkeit einzelner Items schnell ändern oder die Gewichtung einzelner Merkmale in 
den Skalen verändert sich (vgl. Prochazka 2020: 50). 

Neben der Zusammensetzung der Skalen aus den unterschiedlichen Qualitäts- 
merkmalen müssen grundsätzliche Konzeptualisierungen angesprochen werden, die 
in bisherigen Studien teilweise nicht eindeutig diskutiert oder unklar operationa- 
lisiert, aber schon bei der Definition der Begriffe thematisiert wurden. Hier ist 
insbesondere die Beziehung zwischen den wahrgenommenen Qualitätsmerkmalen 
und dem zugeschriebenen Vertrauen bei der Dateninterpretation zu berücksichtigen. 
Eine erste Möglichkeit der Operationalisierung ist eine Gleichsetzung der Qualitäts- 
merkmale und dem wahrgenommenen Vertrauen. Die Schwierigkeit besteht dabei 
in der beschränkten Erklärfähigkeit und Aussagekraft der erhobenen Daten. Pro- 
chazka (ebd.) führt mit Rückgriff auf Jackob, Schultz et al. (2017) beispielsweise 
aus, dass damit nicht erklärt werden kann, wie Medienkritik und fehlende Quali- 
tätswahrnehmung mit sinkendem Vertrauen in Medien und Journalismus zusam- 
menhängen. Damit gibt es in der Vertrauensforschung keine Studienergebnisse für 
gesellschaftlich aktuell hoch relevante Fragestellungen (vgl. Prochazka 2020: 51). 
In weiteren Studien wird Vertrauen als Konstrukt oder latente Variable konzipiert, 
welche nicht direkt beobachtbar ist, sondern sich aus den Qualitätsmerkmalen kon- 
stituiert und deshalb über die wahrgenommenen Indikatoren für Qualität gemes- 
sen wird. Damit sind die wahrgenommenen Qualitätsmerkmale oder -bewertungen 
die Folge des zugrundeliegenden Vertrauens (oder Nicht-Vertrauens). Bei einigen 
Indikatoren scheint dies plausibel, bei anderen weniger: Es würde beispielsweise 
bedeuten, dass eine Person die Qualität oder die Richtigkeit eines Nachrichtenarti- 
kels als hoch bewertet, weil sie dem Artikel vertraut. Dabei gibt es Einwände, ob 
nicht bei einigen Merkmalen die gegenteilige Beziehung vorliegt und die Person 
dem Vertrauensobjekt ein hohes Vertrauen zuschreibt, weil sie zunächst die Quali- 
tätsmerkmale als erfüllt ansieht (vgl. ebd.: 52). In einer dritten Variante werden die 
wahrgenommenen Qualitätsmerkmale teilweise als Einflussfaktoren für Vertrauen 
operationalisiert. Dies wird aber häufig — wie bei der beschriebenen Zusammenset- 
zung der Skalen — weder in der Theorie noch in der Empirie eindeutig beschrieben 
und es wird nicht trennschaft zwischen abhängigen und unabhängigen Variablen 
getrennt. Hierdurch wird die Interpretation der Qualität und Zuverlässigkeit der 
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Daten weiter erschwert. Schwierig ist weiterhin, dass Vertrauen — nach der Begriffs- 
definition (vgl. ausführlich in Abschnitt 4.2.2) — als langfristiges Konstrukt gilt, bei 
dem Lesende mit Hilfe von Heuristiken auf eine unsichere Zukunft hin gerich- 
tet Entscheidungen treffen. Diese entscheidenden Merkmale für Vertrauen werden 
bei der Operationalisierung über die Bewertung verschiedener Qualitätsmerkmale 
einzelner Medieninhalte nicht berücksichtigt (vgl. ebd.: 52 f.). 

Die Defizite der bisherigen Operationalisierung, insbesondere der mangelnde 
Rückbezug auf die theoretischen Bestandteile des Vertrauenskonzepts, berücksich- 
tigt die bereits angesprochene instrumentelle Abfrage von Vertrauen bei Prochazka 
(ebd.) (vgl. Umsetzung der Vertrauensfrage in Abschnitt 4.3.2). Das Vorgehen 
erscheint gewinnbringend, vor allem um die Messinstrumente der Vertrauensfor- 
schung zu professionalisieren und stärker an die Theorie anzubinden. Allerdings 
bezeichnet der Autor selbst die Qualität der Ergebnisse als verbesserungswürdig, 
und eine vergleichsweise geringe Varianzaufklärung — im Vergleich mit den Ergeb- 
nissen der Globalabfrage — scheint auf mögliche Drittvariablen hinzuweisen (vgl. 
ebd.: 220, 235, 270). Prochazka (ebd.) vermutet hier konfundierende Einflüsse durch 
oder „mit der generellen Bereitschaft zur Anschlusskommunikation bzw. dem Inter- 
esse für aktuelle politische Ereignisse“ (ebd.: 270). Die instrumentelle Abfrage 
erbringt damit zunächst zufriedenstellende Messergebnisse, spricht zielführend die 
notwendige Professionalisierung der Messinstrumente in der Vertrauensforschung 
an und stellt eine gute und konkrete Grundlage für die Weiterentwicklung der Instru- 
mente dar. Im qualitativen Setting dieser Arbeit wird mit der Globalabfrage gear- 
beitet?®.). 


4.4 Bedingungen und Voraussetzungen für 
Medienvertrauen 


Neben der Operationalisierung von Vertrauensbeziehungen werden im Folgenden 
die Erkenntnisse der Kommunikationswissenschaft zu Bedingungen, Voraussetzun- 
gen, Gründen und Einflussfaktoren?’ auf Vertrauensentscheidungen in Medien und 
Journalismus mit Fokus auf das Erkenntnisinteresse dieser Arbeit zusammengetra- 


26 Der Leitfaden ist im Anhang dokumentiert 


27 Auch hier spiegelt sich die Heterogenität der Vertrauensforschung wider; so werden die 
Begriffe Bedingungen, Voraussetzung, Gründe und Einflussfaktoren in der Regel synonym 
verwendet für Einflussfaktoren, die auf individueller oder systembezogener Ebene Vertrau- 
ensentscheidungen von Individuen in Beziehung zu verschiedenen Vertrauensobjekten in 
Bezug auf Medien oder Journalismus beeinflussen. Um einer weiteren Ungenauigkeit in der 
Begriffsverwendung vorzubeugen wird im Folgenden von Einflussfaktoren gesprochen. 
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gen. Grundsätzlich werden diese Einflussfaktoren in individuelle und systembezo- 
gene Faktoren unterteilt (vgl. Fawzi, Steindl et al. 2021: 5). Für das vorliegende 
Forschungsinteresse sind aber vor allem die individuellen Faktoren relevant: Ver- 
trauen ist zwar auch von systembezogenen Bedingungen, wie gesellschaftlichen 
oder medialen Rahmenbedingungen abhängig, aber Studien, wie Tsfati und Ariely 
(2014) weisen darauf hin, dass „die Individualebene jedoch deutlich ausschlagge- 
bender zu sein [scheint]“ (Prochazka 2020: 59)8. 

Um Vertrauensentscheidungen im automatisierten Journalismus nachvollziehen 
und eine Exploration der Einflussfaktoren auf diese Urteile erreichen zu können 
(vgl. Forschungsmodell in Kapitel 6) werden in den Folgeabschnitten zwei Schwer- 
punkte näher betrachtet, die sich erneut am Prinzip dieser Arbeit- vom Allgemeinen 
zum Speziellen — orientieren: Zunächst werden die individuellen sozialen und medi- 
enrelevanten Einflussfaktoren auf Vertrauensentscheidungen in Medien und Jour- 
nalismus, die Fawzi, Steindl et al. (2021) zu unterschiedlichen Vertrauensobjekten 
thematisiert haben, zusammengefasst. Diese Darstellung dient dem systematischen 
Überblick der bisher vor allem in empirischen Einzelbefunden zusammengetrage- 
nen Einflussfaktoren auf Vertrauensentscheidungen im Allgemeinen (vgl. Fawzi, 
Steindl et al. 2021: 2f.; Prochazka 2020: 59). Auf dieser Grundlage können in 
der empirischen Untersuchung dieser Arbeit dar Einflussfaktoren auf Vertrauen 
in automatisierten Journalismus untersucht und die Wahrnehmung automatisier- 
ter Nachrichtentexte erhoben werden. Im Folgenden konzentriert sich der zweite 
Abschnitt auf Einflussfaktoren der individuellen Ebene, die speziell zum generali- 
sierten Journalismusvertrauen getestet wurden und thematisiert deren Ergebnisse. 
Beide Perspektiven — die allgemeine systematische Aufarbeitung sowie der Fokus 
auf das Vertrauensobjekt des generalisierten Journalismus — sind wichtig, um einen 
explorativen Zugang zu Vertrauensbewertungen im automatisierten Journalismus 
zu gewährleisten sowie im Speziellen generalisierte Vertrauensurteilen in diesem 
Kontext zu bearbeiteten. Die Arbeit von Prochazka (2020) ist zwar in der systemati- 
schen Aufarbeitung von Fawzi, Steindl et al. (2021) enthalten, soll aber ausführlich 
den Bezug zum generalisierten Vertrauensobjekt über die Metastudie hinweg the- 
matisieren. 


28 Zudem beschränkt sich diese Arbeit auf Vertrauensurteile deutscher Leserinnen und Leser, 
die im deutschen Mediensystem sozialisiert worden sind (vgl. Kapitel 6). Es werden im For- 
schungsstand zur Wahrnehmung automatisiert generierter Nachrichten auch mögliche sys- 
tembezogene Einflussfaktoren gesammelt, wie z. B. die Auswirkungen des Mediensystems 
oder des kulturellen Hintergrunds der Teilnehmenden. Diese müssen aber in Folgestudien 
untersucht werden. 
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4.4.1 Einflussfaktoren für Medienvertrauen im Allgemeinen 


Die Gründe für Medienvertrauen unterteilen Fawzi, Steindl et al. (ebd.) in indi- 
viduelle und institutionelle Einflussfaktoren, die sich jeweils in soziale, politische 
und medienrelevante Gründe gruppieren”. Für den hier vorliegenden Forschungs- 
zweck werden insbesondere die sozialen und medienrelevanten Einflussfaktoren der 
individuellen Ebene berücksichtigt”. 

Als individuelle, soziale Gründe?! für Medienvertrauen werden bisher interper- 
sonales Vertrauen, Misantrophie?”, Involvement und unterschiedliche demographi- 
sche Faktoren berücksichtigt. Als Fazit ihrer Analyse halten Fawzi, Steindl et al. 
(ebd.) fest, dass Vertrauen in Medien eine „stable association with psychologi- 
cal characteristics such as interpersonal trust und conspiracy menthality‘“(ebd.: 6) 
zeigt. Interpersonales Vertrauen wirkt positiv auf Medienvertrauen und Glaubwür- 
digkeit, wohingegen Misantrophie zu geringerem Medienvertrauen und erhöhtem 
Medienzynismus führt. Je mehr die Menschen außerdem in das Nachrichtenthema 
eingebunden sind (so genanntes Involvement), desto eher werden Medien als nicht- 
vertrauenswürdig eingestuft und der Hostile-Media-Effekt steigt”. Die demogra- 
fischen Merkmale zeigen nur inkonsistente Ergebnisse auf mögliche Einflüsse, am 
deutlichsten scheint noch das Alter Auswirkungen auf das Medienvertrauen zu 
haben. Allerdings schränken Fawzi, Steindl et al. (ebd.) die Aussagekraft der Stu- 


29 Auf der institutionellen Ebene folgerichtig als Gründe des sozialen und politischen Systems 
sowie Einflussfaktoren des Mediensystems bezeichnet (vgl. Fawzi, Steindl et al. 2021: 5). 


30 Die Autor:innen differenzieren nicht nach Einflussfaktor je Bezugsobjekt, sondern fassen 
alle Gründe für Medienvertrauen strukturiert zusammen (vgl. ebd.: 5). Außerdem werden die 
Einflussfaktoren der institutionellen Ebene lediglich der Vollständigkeit halber genannt: Bei 
Einflussfaktoren, die sich aus dem sozialen System ergeben und einen positiven oder negativen 
Zusammenhang mit Medienvertrauen aufweisen, werden beispielsweise die wirtschaftliche 
Entwicklung oder die Wertekultur einer Gesellschaft, genannt. Zu den Einflussfaktoren des 
politischen Systems wurden bisher unter anderem die Regierungsform, die Zufriedenheit mit 
demokratischen Akteur:innen oder das politische Vertrauen untersucht. Bei den Gründen für 
Vertrauen, die sich aus dem Mediensystem ergeben, gibt es unter anderem Arbeiten zum Ein- 
fluss des Mediensystems, der Struktur des Medienmarkts oder des Zustands der Pressefreiheit 
(vgl. ebd.: 5). 

31 In einigen Arbeiten auch als Personenmerkmale bezeichnet, z. B. bei Prochazka (2020: 
115). 

32 Im englischen Original als misanthropy im Sinne einer „tendency to generally distrust the 
human species“ (Fawzi, Steindl et al. 2021: 5) bezeichnet; im Deutschen verstanden als ein 
mehr oder weniger ausgeprägtes Misstrauen Menschen gegenüber. 

33 Als Hostile-Media-Effekt wird die Tendenz von Personen bezeichnet, die Medienbericht- 
erstattung zu einem bestimmten Thema „unter bestimmten Umständen als zuungunsten der 
eigenen Meinung verzerrt“ (Dohle 2021) wahrzunehmen. 
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diendaten zu den demografischen Merkmalen ein, da diese in den Primärstudien oft 
als Kontrollvariablen und nicht als unabhängige Variablen berücksichtigt wurden. 
Ein generell geringes Medienvertrauen lasse sich nicht auf einzelne soziale Grup- 
pen zurückführen. Vielmehr vertrauen Mitglieder in allen Bevölkerungsgruppen, 
unabhängig von Alter, Geschlecht, Bildung, Einkommen, Religion oder ethnischer 
Zugehörigkeit, den Medien mehr oder weniger stark (vgl. ebd.: 6).. Insbesondere 
die Ergebnisse zu den demografischen Merkmalen decken sich mit den Ergebnis- 
sen des Forschungsstands zur Wahrnehmung computergenerierter Nachrichten (vgl. 
Abschnitt 5.2.4). 

Bei der Analyse der politischen Gründe für Medienvertrauen beziehen Fawzi, 
Steindl et al. (ebd.) Arbeiten mit ein, die einen Einfluss des individuellen Vertrau- 
ens in öffentliche Institutionen und demokratische Strukturen sowie Einflüsse der 
politischen Meinung und Beteiligung auf das Medienvertrauen berücksichtigen. In 
den Studien werden Messkonstrukte wie politisches Vertrauen, politische Ideolo- 
gie, politisches Interesse, politische Meinungen und subjektiv wahrgenommenes 
Wissen über politische Prozesse sowie politische Beteiligung und deren wahrge- 
nommene Wirksamkeit verwendet. Insgesamt zeigt die Analyse von Fawzi, Steindl 
et al. (ebd.), dass die politische Positionierung, die wahrgenommene individuelle 
Wirksamkeit, die Zugehörigkeit zu einem politischen Lager sowie das Vertrauen 
in politische Strukturen und demokratische Prozesse in mehreren Studien als mög- 
liche Einflüsse auf das Medienvertrauen untersucht wurden und in unterschiedli- 
chen Arbeiten immer wieder unterschiedlich starke Zusammenhänge zum Medien- 
vertrauen deutlich geworden sind. Die Ergebnisse unterscheiden sich teilweise in 
Details”*, insgesamt aber stellen die Autor:innen einen positiven Zusammenhang 
zwischen Vertrauen in öffentliche Institutionen und politische Strukturen sowie dem 
Medienvertrauen dar (vgl. ebd.: 6 f.). 


34 Einzelergebnisse zeigen, dass die politische Ideologie, die Verortung im politischen Mei- 
nungsspektrum sowie das politische Interesse und das subjektiv wahrgenommene Wissen 
über politische Prozesse einen positiven Einfluss auf das Medienvertrauen haben. Außerdem 
korreliert das politische Involvement stark mit der Medienglaubwürdigkeit, wohingegen die 
wahrgenommene externe Wirksamkeit und die Positionierung hinsichtlich einzelner politi- 
scher Themen sowohl positive als auch negative Einflüsse auf das Medienvertrauen aufweisen 
(vgl. Fawzi, Steindl et al. 2021: 6£.). 
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Bei den individuellen medienbezogenen Einflussfaktoren auf Medienvertrauen”° 


führen Fawzi, Steindl et al. (2021) zunächst Studien auf, die sich mit der Wahrneh- 
mung von Nachrichtenqualität und deren Einfluss auf Medienvertrauen beschäfti- 
gen. Erneut zeigt sich die Schwierigkeit der Vergleichbarkeit der Daten, da erstens 
die Begriffe Nachrichtenqualität, Vertrauen und Glaubwürdigkeit oft synonym ver- 
wendet zweitens die Konstrukte sowohl als abhängige und/oder als unabhängige 
Variablen in den Studienkonzeptionen angelegt wurden und sich drittens die Indi- 
katoren der jeweiligen Variablen unterscheiden. Dennoch kann festgehalten werden, 
dass bei Medieninhalten, die als qualitativ hochwertig wahrgenommen werden, auch 
das zugeschriebene Vertrauen wächst. Auch die Ergebnisse von Prochazka (2020) 
sind aufgeführt, nachdem das generalisierte Vertrauen in Journalismus in gleichem 
Maße steigt, wie auch die wahrgenommene Medienqualität als höher bewertet wird. 
Hier scheinen wahrgenommene Richtigkeit und Vollständigkeit der Berichterstat- 
tung ausschlaggebende Indikatoren für Medienqualität zu sein (vgl. Prochazka 
2020: 183; Fawzi, Steindl et al. 2021: 8). Grundsätzlich aber, so führen Fawzi, 
Steindl et al. (2021) weiter aus, zeigt der Forschungsstand, dass die Beurteilung der 
Nachrichtenqualität weniger an den konkreten Medieninhalten, sondern vielmehr an 
‚peripheren Hinweisen‘ wie Medienmarken oder Nutzer:innenkommentaren fest- 
gemacht wird. Einen negativen Einfluss auf das Medienvertrauen haben hingegen 
direkte Medienerfahrungen, beispielsweise als O-Ton-Geber:in oder als Teilneh- 
mer:in eines Medienevents, über das berichtet wurde. Hier ist eine Diskrepanz zwi- 
schen dem eigenen Erleben und der Berichterstattung mit negativem Medienver- 
trauen verbunden. Gleiches gilt für die Wahrnehmung von Media-Bias: Auch hier 
steigt Medienmisstrauen beziehungsweise der Aufbau von Medienvertrauen wird 
erschwert. Dies wirkt sich nicht nur auf den Medieninhalt, sondern auch auf die 
Wahrnehmung der Medienmarke und der Journalist:innen aus (vgl. ebd.: 8). 

Der Einfluss des individuellen ‚Wissens über Medien und deren Strukturen‘ wird 
in der Forschung bisher nur vereinzelt aufgegriffen und es scheint, so das Resümee 
der Literaturanalyse, keine eindeutig lineare Beziehung zwischen dem Wissen über 
Medien und dem Medienvertrauen zu existieren (vgl. ebd.: 8). Studienergebnisse 
zeigen, dass vor allem zwei gegensätzliche Gruppen eine höhere Skepsis gegen- 


35 Fawzi, Steindl et al. (2021) gruppieren die individuellen medienbezogenen Gründe für Ver- 
trauen zum einen in Einflussfaktoren, die sich aus der Medienrezeption und -wirkung ergeben, 
z. B. die wahrgenommene Qualität der Inhalte, das Wissen und die subjektiven Erfahrungen 
im Umgang mit der Berichterstattung, Medienskepsis, den Hostile-Media-Effekt sowie Vor- 
urteilen Medien gegenüber. Zum anderen werden in der Forschung bisher Einflussfaktoren 
untersucht, die sich aus der Auswahl der Nachrichtenquellen, wie etablierten und alternativen 
Medienangeboten, der Mediennutzung und -kompetenz sowie aus dem Konsum bestimmter 
medienkritischer Inhalte ergeben (vgl. ebd.: 5, 7f.). 
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über Journalismus sowie wenig Medienvertrauen angeben: zum einen Menschen 
mit sehr viel Wissen über journalistische Strukturen, also einer hohen Medien- 
kompetenz, und zum anderen Menschen mit besonders wenig Wissen. Eine höhere 
Medienkompetenz kann also dazu führen, dass Menschen informierter, aber auch 
skeptischer gegenüber Journalismus und Medien werden (vgl. ebd.: 9). 

Seit 2000 und verstärkt seit 2017 wird in Studien der Zusammenhang zwischen 
der Nutzung von Mainstreammedien, alternativen Medien oder journalistischen 
Inhalten, die mittels Social Network Sites konsumiert werden, untersucht und ebenso 
deren Einfluss auf das wahrgenommene Medienvertrauen. Dabei konnte ein ver- 
muteter Zusammenhang zwischen einer häufigen Nutzung von Mainstreammedien 
und einem damit einhergehenden hohen Medienvertrauen insgesamt nicht bestätigt 
werden. Die Studienergebnisse sind nicht konsistent und verschieden verwendete 
Messkonstrukte konnten keinen, nur einen geringen Zusammenhang oder nur spezi- 
fische Zusammenhänge, wie etwa bei der Nutzung bestimmter Mediengattung oder 
einzelner Medienmarken und einem höheren Medienvertrauen, feststellen. Stabil 
sind hingegen die Ergebnisse für die gegensätzliche Abhängigkeit: Wenn mehr Ver- 
trauen in spezifische Medien bei den Konsument:innen vorliegt, dann steigt die 
Nutzung dieser Medien (vgl. ebd.: 9). 

Die Literaturanalyse zeigt außerdem Unterschiede in den Ergebnissen, die sich 
aus der Umsetzung der Vertrauensfrage ergeben. Wenn Medienvertrauen im Allge- 
meinen, also in einer globalen und abstrakten Frage (vgl. zur Umsetzung der Vertrau- 
ensfrage Abschnitt 4.3.2), erhoben wird, dann geben die Befragten geringeres Medi- 
envertrauen an und die Berichterstattung insgesamt wird als vorurteilsbehafteter und 
weniger akkurat wahrgenommen. Wenn das Medienvertrauen dagegen als Vertrauen 
in spezifische Medien erfragt wird, dann vertrauen die Befragten den Medien, die 
sie selbst nutzen, halten ihre Medienauswahl aber nicht für repräsentativ für die 
Berichterstattung im Allgemeinen. Damit, so das Fazit von Fawzi, Steindl et al. 
(ebd.), sind die Ergebnisse der Vertrauensfrage insgesamt differenzierter: Insbeson- 
dere die Daten zu möglichen Vertrauensverlusten reflektieren oft, was die Befragten 
als etablierte Mainstreammedien wahrnehmen und beziehen bei den angegebenen 
Vertrauensverlusten nicht die Medien mit ein, die sie selbst konsumieren. Eine wei- 
tere Erklärung für die geringen Auswirkungen der Nutzung von Mainstreammedien 
auf das Medienvertrauen ist, dass Menschen die etablierten Medien nutzen, obwohl 
sie ihnen misstrauisch begegnen, oder sie nutzen diese gerade wegen ihrer Vorbe- 
halte und finden Gefallen daran, kritisch über die Inhalte nachzudenken’®. Trotz 


36 Noch unterschiedlicher sind die verwendeten Messkonstrukte und Ergebnisse, die den 
Einfluss von Nicht-Mainstreammedien und die Nutzung von Social Network Sites für Nach- 
richtenkonsum auf das Medienvertrauen betreffen. Auch hier gibt es inkonsistente Studiener- 
gebnisse und kein eindeutiges Bild, diese sind für das vorliegende Forschungsziel aber nur am 
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Vertrauensverlusten nutzen die Befragten außerdem weiterhin Mainstreammedien, 
wenn ihnen Alternativen fehlen (vgl. ebd.: 9). 

Das Modell von Fawzi, Steindl et al. (2021) zeigt systematisch aggregierte Ein- 
flussfaktoren auf Medienvertrauen. Aus der Darstellung lassen sich Faktoren ablei- 
ten und spezifizieren, die für das Vertrauen in automatisiert generierte Berichter- 
stattung relevant sind und als Grundlage für das Forschungsmodell dieser Arbeit in 
Kapitel 6 dienen. Insgesamt lässt die Literaturanalyse ein breites Spektrum an Grün- 
den für Medienvertrauen erkennen, was erneut die Komplexität des Forschungsge- 
genstands deutlich macht: Die verschiedenen Einflussfaktoren zeigen keine linearen 
und eindeutigen Zusammenhänge, sondern oft spezifische und kleinteilige Ergeb- 
nisse. Für das vorliegende Forschungsinteresse gilt es, Einflussfaktoren unter ande- 
rem aus dem Forschungsstand von Fawzi, Steindl et al. (ebd.) auszuwählen, da das 
Modell beispielsweise nicht nach Art des Bezugsobjekts gegliedert ist und daher 
auch Einflussfaktoren genannt sind, die sich auf ein spezifisches Vertrauen, wie z.B. 
auf Journalist:innen beziehen (vgl. ebd.: 5). 


4.4.2 Einflussfaktoren auf generalisiertes 
Journalismusvertrauen 


Als mögliche Einflussfaktoren auf das generalisierte Journalismusvertrauen berück- 
sichtigen Prochazka (2020) und auch Fawzi und Mothes (2020) vor allem Merkmale 
der individuellen Ebene. Diese Auswahl begründen die Autorinnen mit dem noch 
relativ neuen Forschungsgebiet, der zu leistenden Grundlagenarbeit, einer Reihe von 
Forschungslücken und der zunächst notwendigen grundlegenden Strukturierung des 
Felds (vgl. auch Prochazka 2020: 14f.). Die Beschränkung auf individuelle Faktoren 
stützt sich insbesondere auf die Arbeit von Tsfati und Ariely (2014), die zeigt, dass 


Rande interessant: Fawzi, Steindl et al. (ebd.) merken an, dass die unterschiedlichen Ergeb- 
nisse das breite Spektrum an Inhalten aufzeigen, die in Social Media konsumiert werden und 
nicht die Art der Nachrichtenübermittlung, sondern die konsumierten Inhalte ausschlaggebend 
für steigendes oder sinkendes Medienvertrauen sind. Einen starken Einfluss hat allerdings der 
Konsum von Nachrichtenangeboten, die sich explizit als Alternative zu den etablierten Medien 
positionieren. Hier zeigen mehrere Arbeiten über verschiedene Länder hinweg deutlich und 
konsistent, dass eine Nutzung dieser Medienangebote mit sinkenden Vertrauensniveaus in 
Mainstreammedien einhergehen. Ausschlaggebend für den Einfluss der alternativen Medien 
auf die Glaubwürdigkeit und das Medienvertrauen sind jeweils die Rolle der Medienkritik, 
die Darstellung der Realität und der Einfluss von Verschwörungstheorien sowie die Art der 
Darstellung und die Tonalität der Inhalte. Insbesondere scheint die Berichterstattung rund 
um wichtige gesellschaftliche Ereignisse ein ausschlaggebendes Moment zu sein, welches 
insgesamt zu einer Stärkung oder einem Verlust von Medienvertrauen beiträgt (vgl. ebd.: 10). 
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Merkmale der Systemebene zwar für das Vertrauen in Journalismus wichtig sind, 
die individuellen Einflussfaktoren aber maßgeblich zu sein scheinen (vgl. Tsfati und 
Ariely 2014: 769; Prochazka 2020: 59). 


Personenmerkmale 

Bei den Untersuchungen des Einflusses der Personenmerkmale oder individuellen 
sozialen Gründe auf das generalisierte Journalismusvertrauen’’ hat sich gezeigt, 
dass das Geschlecht der Proband:innen keinen signifikanten Einfluss auf das genera- 
lisierte Journalismusvertrauen hat (vgl. Prochazka 2020: 208) und auch der formale 
Bildungsabschluss das Vertrauen nicht wesentlich beeinflusst. Das Alter hingegen 
hateinen deutlich positiven Einfluss, indem mit dem Lebensalter das zugeschriebene 
Vertrauen steigt. Die soziodemografischen Merkmale sind insgesamt nicht besonders 
erklärungsstark, es gibt aber leichte Effekte durch das Alter und die Kombination von 
Bildungsgrad und psychologischen Merkmalen, nicht aber durch das Geschlecht. 
Interpersonales Vertrauen ist die Grundlage des institutionellen Vertrauens (siehe 
Begriffsbestimmung in Abschnitt 4.2.1) und in der Empirie konnte nachgewiesen 
werden, dass interpersonales Vertrauen einen positiven Effekt auf generalisiertes 
Journalismusvertrauen hat (vgl. ebd.: 206 ff.). Bei den psychologischen Personen- 
merkmalen hat zusätzlich, insbesondere bei dem Versuch, Medienskepsis zu erfas- 
sen, die konstruktivistische Weltsicht einen positiven, und die individuelle Ver- 
schwörungsmentalität hingegen einen deutlich negativen Einfluss auf das Vertrauen 
in Journalismus im Allgemeinen (vgl. ebd.: 208 f.). Außerdem wurden politischer 
Zynismus und politische Selbstwirksamkeit als politikbezogene individuelle Ein- 
flussfaktoren°® auf generalisiertes Journalismusvertrauen untersucht: Beide Merk- 
male zeigen einen positiven Zusammenhang mit der abhängigen Variable Journa- 
lismusvertrauen. Bei den medienbezogenen individuellen Personenmerkmalen gibt 
es Studienergebnisse zum Einfluss des subjektiven und objektiven Medienwissens 
der Befragten auf generalisiertes Journalismusvertrauen, wobei beide Merkmale 
aber nur einen schwach positiven Zusammenhang (vgl. ebd.: 210ff.) aufweisen. 
Einen deutlich stärkeren Zusammenhang zeigt die Einschätzung der Befragten zu 


37 Zur Einordnung der Studienergebnisse muss man anmerken, dass sich Prochazka (2020) vor 
allem mit den Extremwerten des Medienvertrauens beschäftigt und das Ziel seiner Analyse des 
Einflusses der Personenmerkmale vor allem eine Charakterisierung von medienfreundlichen 
und medienskeptischen Personen ist (vgl. ebd.: 205, 220f.). Im Mittelpunkt dieser Arbeit 
stehen dagegen Menschen mit mittleren Vertrauensniveaus und weniger Menschen mit extrem 
hohen oder extrem niedrigen Vertrauenswerten. Deshalb werden im Folgenden nur die für 
den Forschungszweck, relevanten Personenmerkmale beschrieben. 

38 Insbesondere um Medienskepsis zu erklären hat der Autor zusätzlich die Wahlabsicht bezie- 
hungsweise die politische Einstellung als unabhängige Variable eingeführt (vgl. ebd.: 209 f.). 
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der Frage, wie sie das Vertrauen in der Bevölkerung insgesamt einschätzen: Dieses 
wahrgenommene Vertrauensklima hängt positiv mit dem individuellen generalisier- 
ten Vertrauen zusammen (vgl. ebd.: 212 ff.) und liefert vor allem Erkenntnisse, die 
hilfreich sind, um die Gründe für hohes und besonders niedriges Medienvertrauen 
zu untersuchen. 


Qualitätserwartung und -wahrnehmung sowie Diskrepanz der Werte 

Die zugeschriebene Qualität wird — insbesondere in früheren Arbeiten — häufig 
mit Vertrauen gleichgesetzt (siehe Abschnitt 4.2.3) (vgl. Voigt 2016: 94; Pro- 
chazka und Schweiger 2018: 3; Prochazka 2020: 38). Prochazka (2020) stellt in der 
theoretischen Begriffsbestimmung überzeugend dar, warum beide Konzepte nicht 
deckungsgleich sind, und zeigt anschließend auch empirisch, dass Qualitätserwar- 
tungen, die tatsächlichen Wahrnehmungen journalistischer Qualität, die Diskrepanz 
beider Werte und insbesondere die Gründe für wahrgenommene Qualitätsmängel 
als moderierende beziehungsweise unabhängige Faktoren auf generalisiertes Jour- 
nalismusvertrauen zu behandeln sind (vgl. ebd.: 234f.). 

Insgesamt sind die Erwartungen der Rezipienten an journalistische Qualität sehr 
hoch, die wahrgenommene Einhaltung der Qualitätserwartungen dagegen fällt deut- 
lich niedriger aus (vgl. ebd.: 143). Dennoch kann die Diskrepanz zwischen beiden 
Werten alleine keinen relevanten Einfluss auf generalisiertes Journalismusvertrauen 
erklären: Interessanterweise sind aber die wenigen Merkmale, bei denen die Erwar- 
tungen gut erfüllt wurden, nicht unbedingt mit hohem Vertrauen verbunden (vgl. 
ebd.: 185)°°. Damit haben die Erwartungen und Wahrnehmungen von Journalismus 
zwar einen Einfluss auf das generalisierte Vertrauen, dieser ist aber nicht unmittelbar 
zu beobachten, sondern soll im Folgenden kurz erörtert werden. 

Zunächst werden vertrauensrelevante Qualitätsmerkmale angeführt, die sich auf 
die Berichterstattung, die journalistischen Akteur:innen*" sowie auch auf die Eigen- 
verantwortung des Publikums beziehen (vgl. Prochazka 2020: 139). Sowohl in der 
qualitativen als auch in der quantitativen Erhebung wird deutlich, dass es einen Kon- 
sens hinsichtlich vertrauensrelevanter Qualitätserwartungen an etablierte Medien 
gibt. Dazu zählen die Integrität und Fähigkeit der journalistischen Akteur:innen, 
die Richtigkeit und Vollständigkeit der Berichterstattung, die Trennung von infor- 
mierenden und meinungsbildenden Darstellungsformen, die Seriosität der Bericht- 


39 Hier wird erneut deutlich, dass sowohl theoretisch als auch empirisch zwischen den Kon- 
zepten Vertrauen und Qualitätswahrnehmungen unterschieden werden muss, denn „empirisch 
[zeigt sich], dass Vertrauen in Journalismus zu einem Großteil auf anderen Merkmalen basiert 
als auf der Wahrnehmung der Qualität der Berichterstattung“ (Prochazka 2020: 223). 

40 Neben Journalist:innen werden explizit auch die Eigentümer:innen von Medien angespro- 
chen (vgl. ebd.: 190). 
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erstattung sowie die Vielfalt, Ausgewogenheit und Relevanz in der Themenauswahl 
(vgl. ebd.: 140,183). Insgesamt wird von den Medien „vor allem erwartet, korrekt, 
vollständig, neutral und unabhängig zu berichten und damit als ‚neutraler Vermitt- 
ler‘ von Ereignissen aufzutreten“ (ebd.: 183). Es gibt eine Idealvorstellung von 
Journalismus und ein „von Bürger_ innen, Wissenschaft und Praxis gleichermaßen 
getragenes Kernverständnis dazu, was Journalismus sein und leisten soll“ (ebd.: 
183). Die Erwartungen an Journalismus sind über alle vertrauensrelevanten Merk- 
male durchgängig hoch. Dies interpretiert Prochazka (ebd.) als normativ gut, daeine 
hohe Involviertheit darauf schließen lässt, dass die Menschen Journalismus gegen- 
über nicht gleichgültig sind (vgl. ebd.: 185)*!. Die Erwartungen der Lesenden an 
journalistische Qualitätsmerkmale sind hoch, die gemessenen Werte für die tatsäch- 
liche Wahrnehmung fallen dagegen deutlich niedriger aus: Zwar liegen alle Werte 
stabil im Mittelfeld der Skala mit geringen Standardabweichungen und die Mehrheit 
der Befragten schätzt die Erfüllung der addierten Qualitätsmerkmale mittel bis posi- 
tiv ein (70 Prozent der Befragten), die Erwartungen sind aber in allen Merkmalen 
höher als die wahrgenommenen Werte. Zudem weisen die Qualitätsmerkmale, die 
für die Vertrauenszuschreibung als besonders wichtig erscheinen, also „Vollständig- 
keit, Richtigkeit, [...] Trennung von Nachricht und Meinung, Ausgewogenheit und 
Seriosität“ (ebd.: 189) sowie die Tatsache, dass die eigene Meinung widergespiegelt 
wird (vgl. ebd.: 189), die größte Differenz in den gemessenen Einzelwerten auf*?. 
Allerdings hat die Nicht-Erfüllung der Erwartungen - entgegen der ursprünglichen 
Vermutung der Autors — keine besondere Erklärkraft für das Journalismusvertrauen. 
Im Gegenteil: Allein die Werte der Wahrnehmung zeigen mehr Varianz im gemes- 
senen Vertrauen auf (vgl. ebd.: 234). Für generalisiertes Journalismusvertrauen sind 
die vermuteten Gründe für Qualitätsmängel entscheidend: Rezipient:innen sprechen 
die Gefahr gezielter Manipulationen an und/oder vermuten unbeabsichtigte Fehler, 
die beispielsweise aus Überforderung oder Unvermögen der Journalist:innen ent- 
stehen. Diese können das Vertrauen sogar stärken (vgl. ebd.: 150). Insbesondere 
die Angst vor bewussten Manipulationen ist ein starker Faktor für sinkendes Ver- 
trauen (vgl. ebd.: 234f.): „Insgesamt glauben [...] mehr Menschen an Manipulation 


41 Gleichgültigkeit gegenüber Journalismus und Journalismusvertrauen ist eine weitere For- 
schungslücke in der Vertrauensforschung (vgl. ebd.: 269 f.). 


#2 Prochazka (ebd.) verwendet jeweils 19 Qualitätskriterien und fragt, wie wichtig den Rezi- 
pient:innen die einzelnen Items in Bezug auf etablierte Medien sind. Die Items leitet er aus der 
bestehenden Literatur zu Qualitätserwartungen und -wahrnehmungen im Journalismus und 
den Ergebnissen seiner qualitativen Befragung ab. Konkret lautet die Fragestellung, inwie- 
weit es den Befragten wichtig ist, dass die etablierten Medien die genannten Qualitätskriterien 
einhalten, und in einer zweiten Frage, wie die Teilnehmenden die Einhaltung der Qualitäts- 
kriterien beurteilen (vgl. ebd.: 165f.). 
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durch Politik und Medieneigentümer_innen, als an Fehler und Unklarheiten durch 
Komplexität“ (ebd.: 190). 


Erwartung an Leistung der Medien sowie Diskrepanz der Werte 

Neben den Qualitätserwartungen und -wahrnehmungen untersuchen Fawzi und 
Mothes (2020) im Rahmen einer quantitativen Befragung in Deutschland die Wahr- 
nehmungen und Erwartungen an die Leistungen der Medien und die Diskrepanz 
beider Werte auf das allgemeine Vertrauen in Medien und Journalismus**. Im Mit- 
telpunkt stehen sechs normative Funktionen, die journalistische Medien erfüllen 
sollen: Informations-, Kontroll-, Mobilisierungs- und Analysefunktion sowie den 
Auftrag der Förderung des öffentlichen Diskurses durch Vermittlung zwischen Poli- 
tik und Gesellschaft sowie soziale Empathie gegenüber Minderheiten zu fördern (im 
Sinne einer Artikulationsfunktion) (vgl. ebd.: 338). Die Autorinnen können zeigen, 
dass auch bei den Leistungen der Medien, ähnlich wie bei den journalistischen 
Qualitätsmerkmalen, die Erwartungen der Lesenden alle höher sind als die wahrge- 
nommene Leistung. Die Unterschiede zwischen Erwartung und tatsächlicher Bewer- 
tung sind bei den Leistungsmerkmalen auf unterschiedliche Weise mit allgemeinem 
Medienvertrauen verbunden: Zunächst erfüllt Journalismus normative Funktionen 
für die Gesellschaft, z. B. die Informations- und Kontrollfunktion sowie den Auftrag 
ein öffentliches gesellschafts-politisches Austauschforum zu bieten. Diese Leistun- 
gen werden von den Nutzer:innzen als besonders relevant erachtet und es wird 
eine gute Leistung erwartet. Teilweise wird die Erfüllung der Erwartung aber als 
unterdurchschnittlich wahrgenommen und als Konsequenz geben die Lesenden ein 
geringes allgemeines Medienvertrauen an. Für die Analyse- und Mobilisierungs- 
funktion gilt dieser Zusammenhang nicht, hier hat die Diskrepanz zwischen den 
Erwartungen und den wahrgenommenen Leistungen keinen Einfluss auf das allge- 


® Ein wichtiger Teil dieser Studie beschäftigt sich mit Medienskeptiker:innen und Prochazka 
(ebd.) vertieft die Forschung zu fehlendem und sinkenden Medienvertrauen. Hier liefern vor 
allem Qualitätsprobleme (vgl. ebd.: 144), vermutete absichtliche Manipulationen und das 
Gefühl der Bevormundung Erklärungen für sinkendes Medien- und Journalismusvertrauen. 
Der Autor identifiziert weiterhin drei Typen von Medienskeptiker:innen, die sich als Verbin- 
dung mit Personenmerkmalen, der Informationsnutzung und der Wahrnehmung journalisti- 
scher Berichterstattung ergeben (vgl. ebd.: 268). 


44 Außerdem messen die Autorinnen die Einflüsse soziodemografischer, individueller medien- 
und politikbezogener Merkmale der Lesenden auf ihre Erwartungen und tatsächliche Bewer- 
tungen von Medien; dieser zweite Teil ist für das vorliegende Erkenntnisinteresse weniger 
relevant. Die Autorinnen unterscheiden nicht zwischen allgemeinem Medienvertrauen und 
allgemeinem Vertrauen in Journalismus. Nachdem es aber konkret um die normativen Funk- 
tionen von Journalismus für die Gesellschaft geht, werden die Ergebnisse in Bezug zum 
generalisierten Journalismusvertrauen besprochen. 
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meine Medienvertrauen. Die Funktion der Förderung der sozialen Empathie in der 
Gesellschaft dagegen steigert das allgemeine Medienvertrauen, wenn die Diskre- 
panz zwischen Erwartung und Wahrnehmung steigt (vgl. Fawzi und Mothes 2020: 
340 ff.). Dies ist ein für die Autorinnen überraschender Befund, der auf ein gewisses 
Maß an sozialer Erwünschtheit unter den Befragten hinweisen könnte (vgl. ebd.: 
341)®. 


Informationsnutzung 

Als weiterer möglicher Einflussfaktor auf generalisiertes Journalismusvertrauen 
wird der Einfluss der Informationsnutzung der Lesenden berücksichtigt. Der Schwer- 
punkt der Datenauswertung und -aufbereitung liegt hier auf der Nutzung von Alter- 
nativmedien und nicht-journalistischen Quellen in Bezug auf Menschen mit hohen 
oder niedrigen Vertrauensniveaus. Es finden sich in den Ergebnissen aber auch 
deskriptive Befunde zur Nachrichtennutzung von Menschen mit mittleren Vertrau- 
ensniveaus (vgl. Prochazka 2020: 237). Insgesamt wird deutlich, dass „Vertrauen in 
Journalismus (...) zuvorderst an persönlichkeitspsychologischen, politischen und 
medienbezogenen Faktoren [hängt] und (...) weniger stark von der Informations- 
nutzung beeinflusst [ist]“ (ebd.: 238). 


Mess- und Erhebungsverfahren 

Zusätzlich berücksichtigt Prochazka (ebd.) den Einfluss des Messverfahrens und 
der verwendeten Skala auf das angegebene Journalismusvertrauen der Lesenden. 
Hier thematisiert er die Unterschiede zwischen der intuitiven und der instrumen- 
tellen Abfrage des Vertrauens. Die Unterschiede sind insgesamt zwar eher gering 
(vgl. ebd.: 220) (vgl. Operationalisierung in Abschnitt 4.3.2), dennoch ist die Vari- 
anzaufklärung in der intuitiven Abfrage in zwei Merkmalen höher und kann bei 
der Vertrauensabfrage sowie im Zusammenhang mit Personenmerkmalen und der 
Informationsnutzung als die geeignetere Messvariante gelten (vgl. ebd.: 235). Der 
Einfluss des Verfahrens wurde im Abschnitt ‚Schwierigkeiten der Operationalisie- 
rung‘ thematisiert (vgl. Abschnitt 4.3.3). 


45 Zur Vertiefung der Bewertung der gesellschaftlichen Leistung von Medien durch die deut- 
sche Bevölkerung sei zudem auf Fawzi (2020) verwiesen. 
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4.5 Stand und Entwicklung des Journalismusvertrauens in 
Deutschland 


Für einen fundierten Überblick über den aktuellen Stand des Vertrauens in Jour- 
nalismus in Deutschland werden im Folgenden ausgewählte deskriptive Befunde 
dargestellt. Dazu ist neben der deutschen Perspektive auch der Bezug zu interna- 
tionalen Vergleichswerten wichtig, um eine Kontextualisierung des internationalen 
Forschungsstands zur Wahrnehmung computergenerierter Nachrichten in Kapitel 5 
zu erzielen. So erfolgt nach der Auflistung deskriptiver Befunde zur Bundesrepublik 
ein gezielter Rückgriff auf ausgewählte Medienvertrauenswerte weltweit. Insgesamt 
werden ausgewählte Studien und Umfragen berücksichtigt, die zwischen 2019 und 
2021*° erschienen sind. 

Deskriptive Befunde zu Medienvertrauen gibt es aufgrund einer Reihe empi- 
rischer Studien und repräsentativer Umfragen, die sowohl kommerziell als auch 
(teil-)öffentlich finanziert werden. Die Studien lassen sich in Abhängigkeit von der 
Operationalisierung des Vertrauens sowie ihres Studienaufbaus im Wesentlichen 
in zwei Kategorien einteilen: Zunächst gibt es Studien, die überwiegend in kom- 
munikationswissenschaftlichen Forschungskontexten entwickelt werden und deren 
Operationalisierung stark theorie- beziehungsweise modellgeleitet erfolgt. Diese 
Arbeiten messen Vertrauen indirekt und operationalisiert durch multidimensionale 
Skalen, indem Proband:innen (Einzel-)Leistungen des Journalismus bewerten oder 
nach ihrer Zufriedenheit mit der Erfüllung der journalistischen Aufgaben befragt 
werden. In diese Kategorie fallen unter anderem die Arbeiten von Kohring und 
Matthes (2004), Prochazka und Schweiger (2018), Prochazka (2020), Obermaier 
(2020), Blöbaum (2020) oder die Mainzer Langzeitstudie Medienvertrauen bei 
Hölig et al. (2021). Zur zweiten Kategorie gehören Studien, die Medienvertrauen 
in einer direkten Abfrage und meist als Teil eines größeren Fragenkatalogs, bei- 
spielsweise zum allgemeinen Institutionenvertrauen oder zu weiteren gesellschafts- 
politischen Zufriedenheitswerten, erheben. Dazu zählen der Reuters Digital News 
Report, der Edelman Trust Barometer oder der Eurobarometer der Europäischen 
Union. Medienvertrauen wird in der Regel mit einer oder mehreren direkten Fragen 
zum Vertrauen in ‚die Medien‘, ‚die Journalist:innen‘ oder ‚die Nachrichten‘ abge- 
fragt. Häufig kommen eine hohe Teilnehmendenzahl und teilweise repräsentative 
Stichprobenziehungen zum Einsatz, es sind oft Studien im Mehrwellendesign über 


46 Für eine Aufarbeitung der empirischen Daten zu Vertrauen in Medien und Journalismus 
bis zum Jahr 2017 sei insbesondere auf Reinemann et al. (2017), Obermaier (2020: 95-99) 
und Prochazka (2020: 53-55) verwiesen. 
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einen längeren Zeitraum hinweg über die sich zusätzlich häufig auch Länderver- 
gleiche realisieren lassen (vgl. zur Kategorisierung auch Obermaier 2020: 93 f.). 

Zusätzlich zu den Forschungsarbeiten, die sich dezidiert mit Medienvertrauen 
beschäftigen und die nachfolgend ausführlich beschrieben werden, arbeitet Ober- 
maier (vgl. ebd.: 53f.) repräsentative Umfrageergebnisse zum Institutionenver- 
trauen, also zum generalisierten sozialen und politischen Vertrauen in Deutschland, 
auf und zeichnet Entwicklungskurven der Werte bis 2017 nach. In Kürze wieder- 
gegeben zeigen die Ergebnisse, dass das soziale Vertrauen bei einem Viertel der 
deutschen Bevölkerung auf einem hohen bis sehr hohen Niveau liegt und die Werte 
im Zeitverlauf nur leichten Schwankungen unterliegen. Bei der Messung des poli- 
tischen Vertrauens wird unterschieden zwischen repräsentativem politischem Ver- 
trauen, beispielsweise gegenüber der Regierung, Parteien oder Politiker:innen, und 
in Vertrauen, das sich auf implementierende Institutionen, wie Polizei, Justiz und 
Bundeswehr bezieht. Weniger als die Hälfte der Befragten spricht repräsentierenden 
Institutionen hohe Vertrauenswerte aus, wohingegen über die Hälfte der Befragten 
die Frage nach Vertrauen gegenüber implementierenden Institutionen bejaht (vgl. 
Obermaier 2020: 53-57). 


4.5.1 Medien- und Journalismusvertrauen in Deutschland 


Im Rahmen der Mainzer Langzeitstudie Medienvertrauen erheben Forschende der 
Universitäten Mainz und Düsseldorf?’ seit 2008 das Medienvertrauen der deutschen 
Bevölkerung. Seit 2015 werden jährlich rund 1.200 Teilnehmende einer repräsen- 
tativen Auswahl telefonisch befragt”®. Insgesamt zeigen die Ergebnisse der Lang- 
zeitstudie, dass das Vertrauen in etablierte Medien nicht — wie stellenweise immer 
wieder öffentlichkeitswirksam behauptet — sinkt, sondern im Gegenteil sich die 
Mehrheit der Bevölkerung seit 2015 durch stabile Vertrauenswerte auf einem hohen 
Niveau auszeichnet. Seit 1990 vertrauen zwischen mindestens 30 und 50 Prozent 


47 Die aktuellen Daten wurden im Herbst 2020 erhoben und im April 2021 veröffentlicht. Seit 
2019 erfolgt die Finanzierung der Studie aus Forschungsmitteln der projektbeteiligten Wis- 
senschaftler:innen. Die Jahresberichte sind auf der Projekthomepage https://medienvertrauen. 
uni-mainz.de/ (Letzter Zugriff: 01.02.2023) zugänglich. 


48 Ähnlich wie Obermaier (2020) stützt sich die Projektgruppe zur Konzeption von Medi- 
envertrauen auf Forschungsarbeiten zum Vertrauen aus der Soziologie, der Politologie, der 
Kommunikationswissenschaft und der Psychologie und differenziert die Vertrauensobjekte 
entlang der Mikro- Meso- und Makroebene des drei Ebenen-Modells. Die Kernfragen zu 
Medienvertrauen und zur Mediennutzung sind in jeder Befragungswelle gleichlautend, so 
können Auswertungen im Zeitverlauf generiert und Entwicklungstendenzen des Medienver- 
trauens aufgezeigt werden (vgl. Jakobs et al. 2021: 152). 
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der Bevölkerung den Medien eher voll und ganz (vgl. Jackob, Schultz et al. 2019: 
213f., Prochazka 2020: 53). Die Analysen zeigen aber auch, dass Vertrauenszu- 
schreibungen situations- und themenabhängig sind und die Polarisierung des Mei- 
nungsspektrums nicht zu unterschätzen ist: Es gibt einen kleinen, aber stabilen Kern 
an Medienskeptiker:innen, die „den Medien feindselig und ablehnend gegenüber- 
stehen“ (Jakobs et al. 2021: 152). 

Im Wesentlichen folgen die Ergebnisse der Befragung 2020 den beschriebenen 
Mustern, allerdings gibt es einzelne Abweichungen, in denen Trends der vorange- 
gangenen Jahre nicht fortgesetzt wurden. Im Fokus der Erhebung 2020 liegt insbe- 
sondere der Umgang der Gesellschaft mit der COVID-19-Pandemie und die Rolle, 
die Medien in Ausnahme- und Krisensituationen spielen (vgl. ebd.: 152). Diese 
Informations- und Orientierungsfunktion der Medien, die insbesondere in Ausnah- 
mesituationen auftritt, zeigt sich auch in den Studienergebnissen zu Journalismus- 
vertrauen und Medienrezeption. So nutzen seit 2020 wieder mehr Menschen tradi- 
tionelle und etablierte Nachrichtenmedien, um sich zu informieren. Über 60 Prozent 
der Befragten geben an, dass sie fast täglich Angebote des öffentlich-rechtlichen 
Rundfunks nutzen. Dies ist eine deutliche Steigerung zu den 51 Prozent vom Vor- 
jahr. Alle weiteren Mediengattungen konnten nicht profitieren: Die Mediennutzung 
ist gesunken und der Anteil der Menschen, die angeben, überregionale Tageszeitun- 
gen, private Fernsehsender und Boulevardmedien nie zu nutzen, ist gestiegen. Neben 
dem alleinigen Zuwachs in der Mediennutzung können auch nur die Angebote des 
öffentlich-rechtlichen Rundfunks eine Reichweitensteigerung verzeichnen: Alter- 
native Nachrichtenseiten, rein internetbasierte oder über Social Media vermittelte 
Nachrichten haben bei der Mehrheit der Bevölkerung an Reichweite verloren. Neben 
gestiegenen Nutzungszahlen sind 2020 auch die allgemeinen Vertrauenswerte im 
Vergleich zu den Vorjahren gewachsen. So geben über 63 Prozent der Befragten 
an, dass sie den etablierten Medien in der Berichterstattung zur Corona-Pandemie 
vertrauen. Auf die Frage nach einzelnen Mediengattungen erhalten die Angebote 
des öffentlich-rechtlichen Rundfunks mit 70 Prozent Zustimmung die höchsten Ver- 
trauenswerte zugesprochen (von 2016 bis 2019 schwankte der Wert zwischen 65 
und 70 Prozent). Es folgen Regionalzeitungen, überregionale Tageszeitungen, pri- 
vate Fernsehsender und Boulevardmedien, wobei die beiden letztgenannten nur 
geringe Vertrauenswerte aufweisen. Die Reihenfolge und auch die Werte einzel- 
ner Mediengattung sind im Vergleich zu den Vorjahren nahezu gleich geblieben, 
es ist also kein Vertrauenssprung einzelner Angebote zu beobachten. Jakobs et al. 
(ebd.) ergänzen, dass sich das gestiegene allgemeine Medienvertrauen also nicht 
an einzelnen Mediengattungen festmachen lässt, sondern sich vielmehr auf „das 
Mediensystem und den Journalismus als Ganzes [bezieht]“ (ebd.: 161). Seit 2018 
beobachtet die Forschungsgruppe außerdem steigenden Medienzynismus und eine 
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wachsende Anzahl an Medienkritiker:innen. Dieser Trend konnte für das Jahr 2020 
nicht bestätigt werden, Medienzynismus und die Zustimmung zu Verschwörungs- 
erzählungen sind zurückgegangen. Insgesamt sind in der Erhebungswelle 2020 die 
höchsten allgemeinen Medienvertrauenswerte seit Beginn der Studie 2008 gemessen 
worden. Allerdings sind die Forschenden mit langfristigen Prognosen vorsichtig: 
„Mit wachsendem Unmut über die Leistungen der Politik könnten auch die Medien 
wieder an Vertrauen verlieren“, so die Forschenden abschließend (vgl. ebd.: 161). 

Neben der Langzeitstudie Medienvertrauen ist der Digital News Report”? eine 
häufig zitierte Studie, um Medienvertrauen in einzelnen Ländern auch über einen 
längeren Zeitraum hinweg zu analysieren. Auch hier zeigen die Ergebnisse zum 
generalisierten Medienvertrauen in Deutschland ähnliche Befunde. Vertrauen in 
Journalismus wird abgefragt als allgemeines Vertrauen in Nachrichten, als Ver- 
trauen in Nachrichten, die die Teilnehmenden selbst nutzen, sowie als Vertrauen 
in Nachrichten, die über soziale Medien oder Suchmaschinen übermittelt werden. 
Außerdem wird das Vertrauen in einzelne Nachrichtenmarken erhoben. 

Beim allgemeinen Vertrauen in Nachrichten können die Autor:innen steigende 
Werte auf einem hohen Niveau feststellen: So vertrauen 53 Prozent der Befragten 
Nachrichten im Allgemeinen. Für Nachrichten, die die Befragten selbst auswäh- 
len und nutzen, sind in den vergangenen sechs Jahren jährlich stabile Werte mit 
geringen Änderungen festgestellt worden und auch die Ergebnisse 2021 bestätigen 
diesen Trend. So vertrauen aktuell 63 Prozent der Befragten den selbstgenutzten 
Nachrichten’. Zudem wird erfragt, wie viele Menschen der Aussage des allgemei- 
nen Vertrauens nicht zustimmen: Hier zeigt sich nach 2015 zunächst ein Anstieg der 


2 Herausgeber des Digital News Report ist das Reuters Institute for the Study of Journa- 
lism, eine drittmittelfinanzierte Forschungseinrichtung, die 2006 von der Universität Oxford 
gegründet wurde. Die deutsche Teilstudie verantwortet seit 2013 das Hans-Bredow-Institut. 
Für den Jahresbericht 2021 wurden in 46 Ländern repräsentative Befragungen durchgeführt. 
In Deutschland fand sie vom 14.01 bis 05.02.2021 statt. Die Daten sind repräsentativ für 
die erwachsene deutsche Bevölkerung mit Internetzugang (vgl. Hölig et al. 2021: 8). Grund- 
sätzlich sollen mit dem Digital News Report weltweit stattfindende Medientrends erfasst, 
aber auch nationale Besonderheiten der einzelnen Länder dokumentiert und gegebenenfalls 
in Beziehung zueinander gesetzt werden. 


50 Beide Vertrauenswerte sind im Vergleich zum Vorjahr für 2021 einmal um acht beim 
allgemeinen Medienvertrauen beziehungsweise leicht um 3 Prozentpunkte in selbstgenutzte 
Nachrichten gestiegen. Für die allgemeinen Vertrauenswerte ist dies sogar der erste Anstieg 
der Werte seit 2015, wobei die Ergebnisse noch unter denen von vor sechs Jahren liegen. 
Im Jahr 2015 wurde für das allgemeinen Vertrauen in Nachrichten 60 Prozent Zustimmung, 
25 Prozent unentschiedene Teilnehmende und 15 Prozent ablehnende Befragte festgestellt. 
2021 zeigen die Ergebnisse 53 Prozent Zustimmung, 25 Prozent unentschiedene und 22 
Prozent ablehnende Wertungen (vgl. Hölig et al. 2021: 23). Gründe für die Änderung der 
Vertrauenswerte werden im Bericht nicht erhoben. 
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Werte von 15 auf den Höchstwert von 24 Prozent im Jahr 2019 und dann eine Stabili- 
sierung der ablehnenden Werte von 15 Prozent im Jahr 2015 auf 24 Prozent 2018 und 
22 Prozent im Jahr 2021 (vgl. Hölig et al. 2021: 23-25). Für Nachrichten, die über 
soziale Medien oder Suchmaschinen übermittelt werden, bleiben die gemessenen 
Vertrauenswerte auch für 2021 stabil auf einem geringen Zustimmungsniveau. Die 
Ergebnisse zum Vertrauen in 13 ausgewählte Nachrichtenmarken unterscheiden sich 
nicht wesentlich von den Ergebnissen der Vorjahre und folgen dem bereits bekann- 
ten Muster. Mit den höchsten Vertrauenswerten werden die Hauptsendungen der 
öffentlich-rechtlichen Sender (ARD Tagesschau und ZDF: heute) bewertet. An drit- 
ter Stelle rangieren Regional- oder Lokalzeitungen, es folgen, konstant absteigend, 
zunächst ntv und dann die überregionalen Print-Zeitungen und Zeitschriften, die 
häufig als Qualitätspresse bezeichnet werden. Anschließend werden Privatsender, 
Online-Plattformen und sonstige Zeitungen wie Focus, Stern, t-online, RTL aktuell 
aufgeführt. Mit deutlichem Abstand rangiert Bild als Schlusslicht im Ranking (3,4 
Punkte im Gegensatz zu RTL aktuell mit 5,4 Punkten) (vgl. ebd.: 28). Insgesamt 
sind laut Digital News Report 2021 also die allgemeinen Vertrauenswerte in allen 
Altersgruppen erstmals seit 2015 gestiegen und verbleiben auf einem hohen Niveau. 
Die Zustimmungswerte zu allgemeinem Vertrauen werden höher, die Gruppe der 
Medienskeptiker:innen bleibt unverändert, und somit ist das allgemeine Vertrauen 
gestiegen (vgl. Hölig et al. 2021: 23-28; Newman et al. 2021: 18). 

Die bisher zusammengetragenen empirischen Ergebnisse finden sich so auch 
in weiteren repräsentativen Umfragen und Studien zum generalisierten Medien- 
vertrauen der deutschen Bevölkerung. So zeigen beispielsweise auch die Lang- 
zeitaufzeichnungen des Eurobarometers? seit Jahren stabile Vertrauenswerte der 
deutschen Bevölkerung auf einem EU-weit überdurchschnittlichen Niveau. Im Jahr 


5! Weitere Studien, die in unterschiedlicher Form und Intensität Bezug zu Medienvertrauen 
oder -misstrauen nehmen, sind die ARD-ZDF Langzeitstudie Massenkommunikation, und die 
Studie Glaubwürdigkeit der Medien 2020 des WDR. Es sind keine Ergebnisse bekannt, die 
den bisher beschriebenen Datenauswertungen widersprechen oder wesentliche neue Aspekte 
ansprechen. 


52 Das Eurobarometer ist eine Umfrage der Europäischen Kommission zur Meinungsbil- 
dung der Bevölkerung, die seit 1973 in den EU-Mitgliedsstaaten und angrenzenden Ländern 
durchgeführt wird. Dabei wird jeweils ein nationales Barometer mit dem direkten Vergleich 
zu EU-weiten Daten erstellt. Erhoben werden beispielsweise die Einschätzung der sozialen 
Lage, die Zufriedenheit mit der Arbeit der EU-Institutionen oder den Medienangeboten in der 
EU. Die Berichte sind unter https://europa.eu/eurobarometer (Letzter Zugriff: 01.02.2023) 
zugänglich. Für den nationalen Eurobarometer wurden in Deutschland zwischen Februar und 
März 2021 rund 1.600 Büger:innen ab 15 Jahren befragt. Zu den Spezifikationen siehe (vgl. 
Standard Eurobarometer 94 2021a: 8). Im Eurobarometer werden außerdem Fragen zum ein- 
geschätzten politischen und kommerziellen Druck auf Medien, zur Objektivität der Bericht- 
erstattung sowie zu Desinformationskampagnen gestellt. Auch hier bestätigen die Daten die 
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2021 gibt eine Mehrheit von über 77 Prozent der befragten Deutschen an, dass sie 
der Berichterstattung der Medien vertraut. Dies ist eine Steigerung von vier Pro- 
zentpunkten im Vergleich zum Vorjahr und deutlich über dem EU-Durchschnitt von 
aktuell 62 Prozent. Zudem sei auf die Mitte-Studien? verwiesen, die das Vertrauen 
beziehungsweise Medienmisstrauen der Bevölkerung in Deutschland insbesondere 
im Zusammenhang mit rechtsextremen, menschenfeindlichen und antidemokrati- 
schen Einstellungen untersuchen. Laut den Ergebnissen aus dem Jahr 2021 werden 
Medien im Allgemeinen und insbesondere der öffentlich-rechtliche Rundfunk von 
einem relevanten Teil der Gesellschaft zumindest in Frage gestellt: Knapp 30 Prozent 
der Befragten stimmen der folgenden Aussage nicht zu: „[Ö]ffentlich-rechtliche 
Medien sind eine wichtige Säule unserer Demokratie.“ (Rees und Papendick 2021: 
129). Dabei unterscheiden die Befragten durchaus zwischen konstruktiver Medien- 
kritik und einem generalisiertem Medienmisstrauen. Letzteres wird insbesondere 
in rechtspopulistischen und rechtsextremen Milieus geäußert (vgl. ebd.: 128 f.). 
Zusammengefasst ist zu sagen, dass die Studien- und Umfrageergebnisse zu 
generalisiertem Medienvertrauen in Deutschland belegen, dass die Mehrheit der 
Bürger:innen „eine grundsätzliche Zufriedenheit mit den Medien [ausdrückt] und 
[...] ein Grundvertrauen [zeigt], auf das sich die etablierten Medien stützen können“ 
(Jakobs et al. 2021: 161). Insbesondere seit 2015 wurde in der Öffentlichkeit vielfach 
und teilweise hitzig über sinkende und generell niedrige Vertrauenswerte diskutiert, 
wobei sich diese Zuschreibungen in den Studienergebnissen nicht abbilden lassen 
(vgl. auch Hanitzsch et al. 2018: 13 f.). Das Medienvertrauen in Deutschland liegt 
im Mittel stabil auf einem hohen Niveau, wobei detailliertere Analysen durchaus 
zeigen, dass sich neben den Mittelwerten auch extreme Abweichungen in beide 


bisher beschriebenen empirischen Studienergebnissen (vgl. Standard Eurobarometer 94 
2021b: 9f.) 


53 Anm: Die Mitte-Studien werden seit 2006 etwa alle zwei Jahre durchgeführt. Verantwort- 
lich ist die Friedrich-Ebert-Stiftung in Zusammenarbeit mit den Universitäten Leipzig und 
Bielefeld. Schwerpunkt der Studien ist die Datenerhebung zu Rechtsextremismus, Menschen- 
feindlichkeit und antidemokratischen Einstellungen in Deutschland. Thematisiert werden ins- 
besondere der Anteil der Medienskeptiker:innen, die Diskussion um Begriffe wie ‚Lügen-‘ 
und ‚Systempresse‘ Angriffe auf Journalist:innen, Misstrauen gegenüber der journalistischen 
Berichterstattung und Abwertung der Medien. In den Fokus rückt insbesondere die Wahrneh- 
mung der öffentlich-rechtlichen Medienangebote im Vergleich zu Medieninhalten, die privat- 
wirtschaftlich über das Internetangebot vermittelt werden. Außerdem wird die Bewertung von 
Medien und Politik im Systemvertrauen erfragt. Der aktuelle Bericht ist 2021 erschienen. Die 
Daten werden durch telefonische Befragungen mit einer repräsentativen Stichprobenauswahl 
der erwachsenen deutschen Wohnbevölkerung, das heißt unabhängig von der Staatsbürger- 
schaft, erhoben. Die Umfrage erfolgte im Januar und Februar 2021, teilgenommen haben 825 
Befragte (vgl. Rump und Mayerböck 2021: 32-35). 
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Richtungen ergeben. In den letzten fünf Jahren hat sich das Meinungsspektrum zu 
‚ Vertrauen‘ stärker polarisiert. Es gibt mehr Menschen, die sehr hohe Vertrauens- 
werten angeben und andere, die sehr geringes Vertrauen angeben. Innerhalb der 
Mediengattungen genießen die Angebote des öffentlich-rechtlichen Rundfunks die 
höchsten Vertrauenswerte, gefolgt von überregionalen und lokalen Tageszeitungen; 
Boulevardmedien wird wenig generalisiertes Vertrauen entgegengebracht, ebenso 
wie Nachrichten, die über Soziale Medien oder nur über das Internet vermittelt wer- 
den. Die Ergebnisse für das Jahr 2020 zeigen Unterschiede in den Langzeitreihen 
und gegenüber den Trends der vorangegangen Jahre. So ist zuletzt ein deutlicher 
Anstieg des Medienvertrauens zu beobachten. Ob diese Ergebnisse aber als temporär 
beschränkte Ausreißer aufgrund der Ausnahmesituation der COVID-19-Pandemie 
auftreten oder aber einen neuen Trend begründen, das ist langfristig zu beobachten. 


4.5.2 Generalisiertes Medienvertrauen im internationalen 
Vergleich 


Die Mehrheit der bisherigen Studien zur Leser:innenperspektive im automatisierten 
Journalismus und zur Beschreibung des Forschungsobjekts sind nicht in Deutsch- 
land durchgeführt worden (vgl. Kapitel 5). Daher lohnt sich zumindest ein grober 
Überblick über empirische Daten zu generalisiertem Medienvertrauen nicht nur für 
die deutsche Perspektive, sondern auch für den internationalen Vergleich. Teilweise 
sind länderübergreifende Ergebnisse zum generalisierten Medienvertrauen bereits 
mit dem Eurobarometer angesprochen worden, diese werden um weitere Details 
aus dem Digital News Report 2021 sowie speziell zu China aus dem Edelman Trust 
Barometer 2021 ergänzt. 

Im Digital News Report 2021 geben 44 Prozent der Befragten aus 46 Ländern 
weltweit an, dass sie ‚den meisten Nachrichten die meiste Zeit vertrauen‘ (vgl. 
Newman et al. 2021: 19)°*. Damit ist international der allgemeine Vertrauenswert 
im Vergleich zum Vorjahr um sechs Prozentpunkte gestiegen. Bei der Frage nach 
Vertrauen in selbstgewählte Nachrichten steigt der Anteil der Zustimmungen bei 
den Befragten auf 50 Prozent’. Die höchsten allgemeinen Vertrauenswerte des 


54 Die Frage lautet im Englischen: „Thinking about news in general, do you agree or disagree 
with the following statements? I think you can trust most news most of the time.“ (Newman 
et al. 2021: 19). Sie wurde in den nationalen Erhebungen in den jeweiligen Landessprachen 
gestellt und die Daten für den internationalen Vergleich zusammengefasst. 

55 Anm. zur Einordnung der Ergebnisse: In den meisten Ländern dominiert ab 2020 die 
Corona-Pandemie die journalistische Berichterstattung. Die Autor:innen vermuten in dieser 
Dominanz und dem, in der Krise gestiegenen Informationsbedürfnis, die Gründe für den 
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Samples werden in Finnland (65 Prozent Zustimmung), Portugal (61 Prozent) und 
Kenia (61 Prozent) gemessen. Besonders niedrige Vertrauenswerte, mit jeweils zwi- 
schen 30 und 32 Prozent Zustimmung, werden in Frankreich, Griechenland, Bulga- 
rien, Slowakei, Ungarn, Südkorea, Philippinen und Taiwan ermittelt. Der geringste 
Anteil an Zustimmung zum allgemeinen Medienvertrauen mit 29 Prozent wird in 
den USA erhoben. Deutschland liegt mit 53 Prozent im oberen Mittelfeld, weist 
aber geringere Vertrauenswerte auf als die genannten Höchstwerte und beispiels- 
weise auch Dänemark, Norwegen, Niederlande, Thailand oder Brasilien (vgl. ebd.: 
18). Neben dem allgemeinen Medienvertrauen ermitteln die Autor:innen auch die 
Polarisierung des Meinungsspektrums, indem sie den Anteil der Personen, die der 
genannten Vertrauensfrage zustimmen mit dem Anteil der Menschen vergleichen, 
die diese Aussage ablehnen. Dadurch wird je Land ein ‘trust net score’, also ein 
Vertrauensindex berechnet. Diese können so international verglichen werden”. 
Neben den genannten Vertrauensniveaus sind für den automatisierten Journa- 
lismus auch die Werte der Volksrepublik China als, zumindest in Teilen, hoch- 
technologisiertes Land und für Automatisierungen ein aufstrebender und relevanter 
Zukunftsmarkt wichtig. Die im Folgenden genannten Zahlen sollen als Orientie- 
rungswerte dienen und müssen, insbesondere aufgrund der politischen Situation in 
China, der massiven Einschränkungen der Presse- und Meinungsfreiheit und der 
Repressalien gegen die Bevölkerung äußerst kritisch bewertet werden. Das Edel- 
man Trust Barometer 2021" gibt einen allgemeinen Medienvertrauenswert von 51 


Vertrauenszuwachs. Einzig in den USA wurden ein Rückgang des Vertrauens und zudem die 
niedrigsten Einzelwerte im Sample (mit 29 Prozent) gemessen. Als mögliche Gründe für diese 
Abnahme werden die aufgeheizten Debatten um die US-Präsidentschaftswahl oder auch die 
Aufarbeitung des Tods von George Floyd genannt (vgl. ebd.: 19). 

56 Für Finnland, die Niederlande oder Dänemark stellen die Forschenden 2021 beispielsweise 
einen Vertrauensüberschuss von bis zu 48 Punkten (das heißt ein positiver ‘net trust’) fest. 
Für Bulgarien (-12 Punkte), Frankreich (-8 Punkte), Ungarn (-6 Punkte), Chile (-4 Punkte) 
und Argentinien (-3) ermitteln sie dagegen Vertrauensdefizite. Deutschland liegt mit einem 
Index von 31 Punkten wieder im oberen Mittelfeld (vgl. Hölig et al. 2021: 24). Die Werte der 
USA hingegen stellen auch für die Polarisierung einen Extremwert da: Der Vertrauensindex 
liegt bei -15 Punkten, das heißt, es gibt deutlich mehr Menschen, die den Medien misstrauen 
als Personen, die den Medien vertrauen (vgl. Newman et al. 2021: 19). 


57 Das Edelman Trust Barometer wird seit 2000 regelmäßig als Onlinebefragung in über 25 
Ländern durchgeführt. Verantwortlich ist die Kommunikationsagentur Edelman, die zusätz- 
lich auch Sponsor für den Digital News Report ist. Für die Vertrauensfragen wird jeweils eine 
Stichprobe der erwachsenen Gesamtbevölkerung eines Landes befragt, wobei 2021 knapp 
über 80 Prozent aller Befragten weltweit einen Internetzugang angeben. Damit ist auch 
hier (wie beim Digital News Report) die Aussagekraft einer Onlinebefragung in Ländern 
mit wenig Internetdurchdringung individuell zu beurteilen beziehungsweise nur für Online- 
Nutzer:innen repräsentativ (vgl. Ries und Jeffrey 2021: 52). Im Jahr 2021 wurden je 1.150 
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Prozent der Befragten weltweit aus und misst damit eine Steigerung des Vertrauens 
im Gegensatz zum Vorjahr in insgesamt 15 der 27 gemessenen Nationen. China 
weist mit einem Vertrauensanteil von 70 Prozent den zweithöchsten Wert der Rang- 
folge auf. Wie erwähnt, muss dieser Wert unter Berücksichtigung der fehlenden 
Meinungsfreiheit kritisch betrachtet werden. Deutschland liegt mit einem Wert von 
52 Prozent im Mittelfeld, und die USA werden mit 45 Prozent Vertrauensanteil zur 
Gruppe der dreizehn ‘distrusted countries’ (vgl. Ries und Jeffrey 2021: 45) gezählt. 

Zusammenfassend lässt sich berichten, dass der Digital News Report, das Edel- 
man Trust Barometer und das Eurobarometer übereinstimmend berichten, dass das 
generalisierte Medienvertrauen im Jahr 2021 sowohl in Europa als auch weltweit — 
mit Ausnahme der USA - im Vergleich zum Vorjahr gestiegen ist. Deutschland liegt 
mit den gemessenen Vertrauenswerten im oberen Mittelfeld auf einem stabilen und 
vergleichsweise hohen Niveau. In China werden Höchstwerte des Medienvertrau- 
ens angegeben — hier muss die politische Situation und Einschränkung der Presse- 
und Meinungsfreiheit beachtet werden — und die USA befinden sich bei den Ran- 
kings im unteren Bereich. Die Studienergebnisse zeigen eine hohe Variation der 
Werte auch innerhalb der Kontinente. Es gibt zwar Tendenzen wie z. B. die eher 
niedrigen Vertrauensniveaus in den skandinavischen und nordeuropäischen Ländern 
und hohe Werte in asiatisch-pazifischen Nationen, dennoch ist weder eine eindeu- 
tige Struktur noch sind klare Zusammenhänge beispielsweise hinsichtlich der in 
Abhängigkeit des Mediensystems, der Pressefreiheit oder der sozio-ökonomischen 
Lage des jeweiligen Landes zu erkennen. Hier wären weitere Studien notwendig, 
um länderübergreifend die Daten und deren Erhebung zu überprüfen und Einfluss- 
faktoren auf das generalisierte Medienvertrauen weltweit zu systematisieren (vgl. 
auch Hanitzsch et al. 2018). Für die Analyse des Medienvertrauens im automatisier- 
ten Journalismus in Kapitel 5 sei insbesondere auf die niedrigen Werte Südkoreas 


Teilnehmende in 28 Nationen befragt und eine zusätzliche Erhebung in den USA nach der 
Präsidentschaftswahl durchgeführt (vgl. ebd.: 2). Vertrauen in die Medien wird in der Studie 
als institutionelles Medienvertrauen in Zusammenhang mit Vertrauen in die Regierung, NGOs 
und die Privatwirtschaft abgefragt. Für weitere technische Spezifikationen, z. B. Samplebil- 
dung und Operationalisierung, siehe (vgl. ebd.: 2, 51-55). Die Ergebnisse des Digital News 
Reports und des Edelman Trust Barometers sind nicht deckungsgleich, die Daten zeigen seit 
Jahren vergleichbare Ergebnisse (vgl. z. B. Obermaier 2020: 95-98). China ist nicht Teil des 
Digital News Reports. Das Edelman Trust Barometer gibt deshalb zumindest eine grobe Ein- 
schätzung der Vertrauenswerte der Volksrepublik im internationalen Vergleich an, was für die 
vorliegende Arbeit aussagekräftig ist. 
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hingewiesen’®, die in der Aufarbeitung der Rezeptionsstudien in Kapitel 5 weiter 
thematisiert werden. 


4.6 Zwischenfazit Il: Generalisiertes 
Journalismusvertrauen 


Für eine systematische Aufarbeitung des Forschungsstands zu Vertrauen in Journa- 
lismus wurde die kommunikationswissenschaftliche Vertrauensforschung zunächst 
als Teil der Medienbewertungsforschung eingeordnet. Anschließend erfolgte die 
Begriffsbestimmung und es wurde argumentiert, dass der Vertrauensbegriff für das 
Vorgehen der vorliegenden Arbeit am geeignetsten ist. Dazu wurden die Operatio- 
nalisierung des Medien- bzw. Journalismusvertrauens dargestellt und verschiedene 
Vertrauensbeziehungen, Vertrauensobjekte und Arten der Vertrauensfrage themati- 
siert sowie Schwierigkeiten der Operationalisierung angesprochen. Zudem erfolgte 
die Darstellung der bisher erhobenen Einflussfaktoren für Medienvertrauen und 
generalisiertes Journalismusvertrauen, und abschließend wurden empirische Stu- 
dien zum Vertrauen in Journalismus vorgestellt. Erläutert wurde, dass die Verwen- 
dung des Medienglaubwürdigkeitsbegriffs für die Konzeption der Studien im For- 
schungsstand zur wahrgenommenen Glaubwürdigkeit computergenerierter Texte 
(vgl. Kapitel 5) zielführend ist, insbesondere da konkrete Stimulitexte bewertet 
werden. Für die intensive Reflexion der Wahrnehmung des automatisierten Journa- 
lismus, wie es Schwerpunkt der vorliegenden Arbeit ist, greift der Glaubwürdig- 
keitsbegriff aber zu kurz. Daher wurde der Vertrauensbegriff eingeführt und für den 
Forschungszweck systematisch aufgearbeitet. Die intensive Darstellung der Ver- 
trauensforschung ist angesichts des vorliegenden Forschungsstands notwendig, um 
die Ergebnisse kontextualisieren zu können und - insbesondere bei einem explo- 
rativen Forschungszugang — einen fundierten Ausblick und eine Vorbereitung für 
Folgestudien zu leisten. 

Generalisiertes Journalismusvertrauen wird in dieser Arbeit verstanden als Ver- 
trauen der Lesenden gegenüber Journalismus als Ganzes und bezieht sich damit 
nicht auf spezifische Vertrauensobjekte — wie beispielsweise konkret genutzte 
Einzelmedien —, sondern auf einen abstrakten Vertrauensbegriff. Als generali- 
siertes Vertrauensobjekt wird die Vorstellung der Lesenden von Journalismus 


58 Laut Edelman Trust Report vertrauen nur 40 Prozent der Bevölkerung den Medien (vgl. Ries 
und Jeffrey 2021: 45). Außerdem bestätigen 77 Prozent der Befragten in einer zusätzlichen 
Frage zur Zufriedenheit mit journalistischen Leistungen, dass sie mit den Leistungen der 
Medien unzufrieden sind. Nur Japan weist mit einem Anteil von 80 Prozent der Befragten, 
die hier zustimmen, weltweit noch höhere Werte auf (vgl. ebd.: 25). 
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beziehungsweise automatisiertem Journalismus als Ganzes verstanden. Damit ist 
eine generelle Haltung gegenüber dem automatisierten Journalismus beziehungs- 
weise eine Vorstellung von den etablierten Mainstream-Medien gemeint, die mit 
journalistischer Textautomatisierung arbeiten. Bisherige Studien konnten zeigen, 
dass Lesende eine Vorstellung von Journalismus als Ganzes haben und damit in 
der Empirie eine Vorstellung des generalisierten Vertrauensobjekts ‚Journalismus‘ 
besteht. Dies ist die Grundlage des in dieser Arbeit verwendeten Vertrauensbegriffs, 
die sich speziell mit automatisiertem Journalismus beschäftigt. 

Die Verwendung des generalisierten Vertrauensbegriffs ist für die vorliegende 
Arbeit zielführend, da Ergebnisse zeigen (vgl. Kapitel Ergebnisse 8), dass sich 
Lesende - insbesondere wegen geringer Kenntnisse zum Begriff des automatisierten 
Journalismus und aufgrund fehlendem bewussten Kontakt mit automatisiert gene- 
rierten Nachrichten — in der Regel auf automatisierten Journalismus als abstrakten 
Begriff beziehen. Zusätzlich zeigen die Datenauswertungen aber auch, dass die 
Teilnehmenden sich an einigen Stellen auf spezifische Vertrauensobjekte beziehen, 
wie z. B. einzelne Medien, die mit Textautomatisierungen arbeiten. Deshalb liegt 
der Schwerpunkt der vorliegenden Arbeit mit dem Ziel der Exploration der Vertrau- 
enszuschreibungen in automatisiertem Journalismus auf generalisierten Vertrauens- 
beziehungen, wobei die systematische Aufarbeitung der Vertrauensforschung auch 
geeignet ist, um spezifische Vertrauensobjekte einordnen und für Folgestudien vor- 
bereiten zu können. 

Als Einflussfaktoren auf generalisiertes Journalismusvertrauen wurden ausge- 
wählte Personenmerkmale, z. B. soziodemografische und psychologische Merk- 
male, sowie politik- und medienbezogene Merkmale thematisiert. Die für diese 
Arbeit als relevant identifizierten Einflussfaktoren werden in Abbildung 4.1 zusam- 
mengefasst. Dabei zeigen soziodemografische Merkmale keine relevanten Zusam- 
menhänge mit generalisiertem Journalismusvertrauen. Psychologische und politik- 
bezogene Einflussfaktoren werden bisher vor allem in Zusammenhang mit fehlen- 
dem Vertrauen und Medienskeptiker:innen untersucht. Für die vorliegende Arbeit 
ist relevant, dass das wahrgenommene Vertrauensklima in der Bevölkerung einen 
deutlichen Einfluss auf das Journalismusvertrauen der Lesenden hat. Zudem zeigen 
das individuelle Wissen über Journalismus und die Informationsnutzung der Lesen- 
den schwach ausgeprägte positive Zusammenhänge. Neben den Personenmerkma- 
len wird außerdem der Einfluss der Erwartung und der Bewertung verschiedener 
Qualitäts- und Leistungsmerkmale durch die Lesenden erhoben und zudem geprüft, 
ob eine Diskrepanz aus Wahrnehmung und Erwartung Auswirkungen auf die Ver- 
trauensbewertung von Journalismus hat. Die Ergebnisse zeigen, dass Lesende klar 
formulierte Qualitäts- und Leistungserwartungen haben und Vertrauen in Journalis- 
mus allgemein positiv beeinflusst wird durch die wahrgenommene Genauigkeit der 
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Abbildung 4.1 Für das Erkenntnisinteresse relevante Einflussfaktoren aus dem Forschungs- 
stand zu Vertrauen in journalistische Medien. (Eigene Darstellung in Anlehnung an Fawzi, 
Steindl et al. (2021), Prochazka (2020)) 


Berichterstattung, die Relevanz der ausgewählten Themen, die Trennung von infor- 
mierenden und kommentierenden Darstellungsformen sowie die wahrgenommene 
Seriosität der Berichterstattung. Insbesondere Genauigkeit, so Prochazka (2020), 
scheint mit Vertrauensbewertungen verbunden zu sein. Insgesamt haben die Lesen- 
den meist höhere Erwartungen an die Qualität der Berichterstattung, als sie die 
tatsächliche Wahrnehmung bewerten, wobei eine hohe Diskrepanz beider Werte in 
der Regel keinen direkten Zusammenhang zum bewerteten Journalismusvertrauen 
zeigt. Entscheidend sind vielmehr die Gründe für wahrgenommene Qualitätsmän- 
gel: Hier unterscheiden die Lesenden zwischen unbeabsichtigten Fehlern, die kei- 
nen Einfluss auf Vertrauensbewertung haben, und gezielten Manipulationen, die 
das Vertrauen deutlich senken. Zusätzlich wurden im vorliegenden Kapitel wei- 
tere Einflussfaktoren auf Medienvertrauen im Allgemeinen thematisiert, die sich 
auf die Systematisierung von Fawzi, Steindl et al. (2021) beziehen und für die 
Exploration des Vertrauens in automatisierten Journalismus zusätzlich mögliche 
Einflüsse der individuellen sozialen und medienrelevanten Gründe aufzeigen. Die 
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Einflussfaktoren, die im Rahmen dieser Arbeit untersucht werden, basieren auf 
den genannten Ausführungen und werden — zusammen mit den identifizierten 
Forschungslücken - in Kapitel 6 zusammengetragen. 
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Glaubwürdigkeit und Vertrauen in 5 
automatisiert generierte Nachrichtentexte: 
Forschungsstand zur Wahrnehmung der 
Lesenden 


Im Folgenden wird der Forschungsstand zur Wahrnehmung computergenerierter 
Nachrichten durch Leser:innen in einer umfassenden Literaturanalyse aufgearbei- 
tet. Neben der Darstellung der Studienergebnisse liegt der Schwerpunkt des Kapitels 
auf den bisher verwendeten Studiensettings und der getesteten Variablen. Ziel ist 
es, eine fundierte Grundlage für die intensive Auseinandersetzung mit Vertrauens- 
bewertungen im automatisierten Journalismus im Rahmen dieser Arbeit, aber auch 
für Folgestudien zu erzielen. Dazu werden aus dem bisherigen Forschungsstand 
Einflussfaktoren auf die Wahrnehmung computergenerierter Nachrichten und die 
jeweiligen Kontexte der Studien aufgearbeitet, welche die Faktoren der generali- 
sierten Vertrauensbewertungen im Journalismus aus Kapitel 4 ergänzen. 

Es gibt bislang keine Studien, die gezielt Vertrauensbewertungen der Lesen- 
den im Bezug auf den automatisierten Journalismus thematisieren. International 
sind 15 relevante Online-Experimente mit standardisierter Befragung zur Wahrneh- 
mung computergenerierter Berichterstattung erschienen (vgl. Clerwall 2014; Van 
der Kaa und Krahmer 2014; Jung et al. 2017; Haim und Graefe 2017;Graefe, Haim 
et al. 2018; Wölker und Powell 2018; Waddell 2018; Zheng et al. 2018; Melin 
et al. 2018; Liu und Wei 2019; Waddell 2019; Wus 2020; Jia 2020;Tandoc Jr. et al. 
2020; Haim und Graefe 2018a). Zudem haben Graefe und Bohlken (2020) eine 
Metaanalyse der bisherigen Studienergebnissen veröffentlicht. Die Wahrnehmung 
automatisiert generierter Nachrichten wird in den Studien überwiegend durch die 
Bewertung der wahrgenommenen Qualität, Lesbarkeit und Glaubwürdigkeit ope- 
rationalisiert. Dem Forschungsinteresse dieser Arbeit folgend konzentriert sich die 
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Literaturanalyse auf die abhängigen Variablen Glaubwürdigkeit beziehungsweise 
Vertrauen. Vertrauen oder Vertrauenswürdigkeit werden in neun der 15 Publikatio- 
nen thematisiert; überwiegend wird Vertrauen als Bestandteil der Textglaubwürdig- 
keit konzipiert, teilweise als Item der Wahrnehmung berücksichtigt oder vereinzelt 
auch als eigenständige Variable verwendet (vgl. Abschnitt 5.2.3). Da Glaubwürdig- 
keit und Vertrauen sowohl in der Theorie als auch in der Empirie vielfach synonym 
verwendet werden (vgl. ausführlich Abschnitt 4.2.3), ist eine systematische Auf- 
arbeitung der Ergebnisse zur bewerteten Glaubwürdigkeit automatisiert generier- 
ter Nachrichten gewinnbringend für die Exploration der Vertrauenszuschreibung in 
automatisierten Journalismus. Insgesamt wird im Forschungsfeld deutlich beschrie- 
ben, dass weiterführende Erkenntnisse zum Umgang der Lesenden mit automati- 
sierten Journalismus und zur Wahrnehmung der Texte fehlen (vgl. z. B. Haim und 
Graefe 2017: 1057; Jia 2020: 2626). Diese Forschungslücke steht im Zentrum der 
vorliegenden Arbeit. 

Die Aufarbeitung des Forschungsstands zu Wahrnehmung computergenerierter 
Nachrichten mit Blick auf die Vertrauensbewertung des automatisierten Journalis- 
mus ist an einigen Stellen vergleichsweise unübersichtlich: Zum einen wird die 
Analyse durch die Komplexität der Medienbewertungsforschung beeinflusst, die 
bereits ausführlich in Kapitel 4 thematisiert wurde. Medienbewertungen und Ver- 
trauensurteile sind heterogen und mehrdimensional operationalisierte Konstrukte. 
Es gibt keine monokausalen Erklärungen für Vertrauen oder Glaubwürdigkeit, die 
Menge an bisher thematisierten Einflussfaktoren ist unvollständig und mögliche 
Wechselwirkungen zwischen einzelnen Faktoren werden in der Forschung nicht 
oder nur wenig thematisiert. Kommunikationswissenschaftliche Vertrauensmodelle 
berücksichtigen zudem weder die Entstehung von Vertrauen im Zeitverlaufnoch den 
Umgang der Nutzer:innen mit neu entstehenden Technologien (vgl. Forschungs- 
lücken in Abschnitt 6.1). Zum anderen ist auch die Analyse der genannten Rezepti- 
onsstudien in Teilen unübersichtlich, da die Studien zwar im Aufbau ähnlich sind, 
sich aber deutliche Unterschiede in der Detailbetrachtung zeigen: Auch hier wer- 
den Einflussfaktoren und Begriffsoperationalisierungen teilweise ohne theoretische 
Ableitung ihrer Bezüge eingeführt. Außerdem tauchen Widersprüche in den Ergeb- 
nissen auf, wenn — über eine oberflächliche Betrachtung der Ergebnisse hinweg — 
gezielt einzelne Einflussfaktoren oder mögliche Wechselwirkungen besprochen 
werden. Zudem sind in den Studien, allein durch die Rekrutierung, den Zeit- 
punkt der Studien, die Anordnung und Auswahl der Stimuli neue Einflussfakto- 
ren angelegt, die über die Konzeption der unabhängigen Variablen hinausgehen. 
Diese sorgen dafür, dass der Forschungsstand zu konkreten Einflussfaktoren auf 
die Wahrnehmung automatisiert generierter Nachrichten komplexer ist, als dies 
auf den ersten Blick scheint. Außerdem muss im Einzelfall die Vergleichbarkeit der 
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Ergebnisse berücksichtigt werden; die Studien sind international publiziert und nicht 
alle Ergebnisse lassen sich beispielsweise auf die Bundesrepublik übertragen. Als 
dritter Aspekt muss berücksichtigt werden, dass sich in den Rezeptionsstudien im 
Gegensatz zur Aufarbeitung der Vertrauensforschung in Kapitel 4 das Bezugsob- 
jekt der Medienbewertung ändert: Ziel der vorliegenden Arbeit ist die Exploration 
der Vertrauensbewertungen der Lesenden im automatisierten Journalismus bezie- 
hungsweise bezogen auf Journalismus als Ganzes, der teilweise mit Automatisie- 
rungen arbeitet. In den Rezeptionsstudien dagegen werden konkrete Stimuli und 
automatisiert generierte Nachrichten bewertet. Dies wurde bereits bei der Ausein- 
andersetzung mit dem Glaubwürdigkeits- und Vertrauensbegriff angesprochen und 
wird weiterhin im Kapitel 6 thematisiert. 

Sowohl aus der Perspektive der bisherigen Forschung zur Wahrnehmung com- 
putergenerierter Nachrichtentexte als auch aus der Perspektive der Forschung zu 
Vertrauen in Journalismus als Ganzes ist insgesamt eine explorative, offene, aber 
dennoch zielgerichtete Herangehensweise notwendig, um Einflussfaktoren auf die 
Vertrauensbewertung im Umgang der Lesenden mit automatisiertem Journalismus 
zu generieren oder teilweise zu testen. Dazu ist neben der Darstellung der Studiener- 
gebnisse die detaillierte Aufarbeitung der Studien notwendig, um — auch über diese 
Arbeit hinweg — die kommunikationswissenschaftliche Forschung zu Vertrauen in 
automatisierten Journalismus zu systematisieren und weiterzuentwickeln. 


5.1 Dokumentation der Literaturanalyse 


Ziel der Literaturanalyse ist die Aufarbeitung der Studienergebnisse und die umfas- 
sende Dokumentation der verwendeten Studiensettings. Im Wesentlichen ist der 
Aufbau der Studien ähnlich: Es handelt sich um Online-Experimente mit anschlie- 
Bender Online-Befragung. Wie im Folgenden dargestellt, unterscheiden sich die 
Arbeiten und ihre Ergebnisse in der Detailbetrachtung aber teilweise deutlich. 
Um der Heterogenität gerecht zu werden, erfolgt eine detaillierte Analyse der bis- 
her verwendeten Studien durch eine Systematisierung der Operationalisierung der 
verwendeten Variablen, der Aufarbeitung der Studienkontexte und verschiedenen 
Schwerpunkte der Arbeiten sowie die Darstellung der detaillierten Studienergeb- 
nisse. Umgesetzt wird die Analyse durch eine eigene Literaturanalyse, welche die 
Metastudie von Graefe und Bohlken (2020) erweitert und vertieft. 


Erweiterung und Vertiefung der bestehenden Metaanalyse 
Graefe und Bohlken (ebd.) führen eine Metaanalyse zur Wahrnehmung computer- 
generierter Nachrichten von Lesenden ohne journalistischen Hintergrund durch. 
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Die Autor:innen verwenden im Wesentlichen die Studienauswahl, die auch für 
die Literaturanalyse dieser Arbeit getroffen wurde!. Die aggregierten Daten der 
Metastudie sind für die Darstellung der Primärstudienergebnisse gut geeignet. Für 
die detaillierte Aufarbeitung, die eine Identifikation von Forschungslücken und die 
Exploration von Einflussfaktoren auf die Vertrauensbewertung des automatisierten 
Journalismus ermöglicht, greift die Analyse zu kurz. Für den vorliegenden For- 
schungszweck ist es notwendig, die Studiensettings, die verwendeten Variablen 
und die Studienergebnisse im Detail darzustellen. Dazu wird eine eigene Literatur- 
analyse durchgeführt. Notwendig ist diese Detailbetrachtung, weil beispielsweise 
eine Aufarbeitung der Zeitpunkte, an denen die Studien stattgefunden haben, Auf- 
schluss über den Stand der Technologie und die Validität der Stimuli gibt. Außerdem 
berichten insbesondere chinesische und südkoreanische Forscher:innen über kultu- 
relle Unterschiede in der Technologiebewertung und damit auch der Wahrnehmung 
von computergenerierten Nachrichten im Vergleich zu europäischen oder amerika- 
nischen Teilnehmenden (vgl. Tandoc Jr. et al. 2020; Jia 2020; Liu und Wei 2019; 
Jung et al. 2017). Deshalb muss im Folgenden die Vergleichbarkeit und mögliche 
Übertragbarkeit der Ergebnisse der Primärstudien diskutiert werden. 


Dokumentation der systematischen Literaturanalyse 

Die Suche nach relevanten Studien zur Erarbeitung des Forschungsstands wird in 
vier Schritten durchgeführt, die im Folgenden dokumentiert sind. Die Kriterien der 
Relevanzprüfung werden nach Darstellung der Suchschritte aufgelistet. 


1. Im November 2020 und Mai 2021 wird eine Suche mit Hilfe von Google Scholar 
und den Searchstrings ‘automated journalism’ sowie ‘automated journalism rea- 
der perception’ durchgeführt. Die Suche ergibt insgesamt etwa 400 Treffer, 
davon werden die ersten 100 Einträge extrahiert und händisch durchsucht. 

2. Im Schneeballverfahren wird die entstandene Liste um Arbeiten ergänzt, die 
über die Suchmaschinen ConnectedPapers, researchgate.net und den OPAC der 
Universität Bamberg mit dem gleichen Searchstrings wie in Schritt Eins gefun- 
den wurden. Außerdem werden die Datenbanken der Zeitschriften Journalism 
und Digital Journalism nach ‘automated journalism reader’? durchsucht. 


! In der Literaturanalyse werden 15 Publikationen mit 18 (Teil-)studien berücksichtigt. Graefe 
und Bohlken (2020) verwenden zwölf Studien in elf Publikationen leisten einen umfassen- 
den Einstieg zur Wahrnehmung des automatisierten Journalismus durch Leser:innen (vgl. 
ausführlich Abschnitt 5.2.4). 

? Bis auf die Publikation von Haim und Graefe (2018a) sind alle Arbeiten in Englisch publi- 
ziert, daher wurde auf die Suche mit deutschen Stichworten verzichtet. 
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3. Auch die Literaturverzeichnisse der bisher identifizierten Arbeiten werden ver- 
wendet, um weitere Studien zu finden. Außerdem wird in den genannten Such- 
maschinen nach bisher identifizierten Autor:innen gesucht. 

4. Abschließend wird kontrolliert, ob die Literaturverzeichnisse der Einstiegs- bzw. 
Überblicksliteratur zum automatisierten Journalismus weitere Arbeiten zur Per- 
spektive des Publikums beinhalten, die bisher nicht verwendet wurden (vgl. z.B. 
Haim und Graefe 2018b; Thurman 2020; Diakopoulos 2019). 


Für den Forschungszweck als relevant erachtet und in die Studienauswertung 
inkludiert wurden kommunikationswissenschaftliche Arbeiten, die ein peer-review- 
Verfahren durchlaufen haben oder in einem renommierten Verlag erschienen sind’. 
Zudem müssen die Arbeiten in Englisch oder Deutsch erschienen sein. Insgesamt 
werden nur Publikationen aufgenommen, die sich auf Journalismus beziehen. Arbei- 
ten aus der Linguistik oder der Informatik werden ausgeschlossen. Das gilt auch 
für kommunikationswissenschaftliche Arbeiten, die sich mit der Variationen der 
Kennzeichnung automatisiert generierter Nachrichten beschäftigen. Dieser spezi- 
elle Fokus ist für das vorliegende Forschungsinteresse der generellen Wahrnehmung 
und Vertrauensbewertung nicht relevant. 


Ergebnisse der systematischen Literatursuche 

Die Literatursuche ergibt 15 relevante Rezeptionsstudien, die zwischen 2014 und 
2020 erschienen sind und die Wahrnehmung der Lesenden in Bezug auf automa- 
tisiert generierte Nachrichten erheben. Davon sind 14 Arbeiten als Primärstudien 
angelegt und werden von einer Sekundäranalyse ergänzt*. Weiterhin umfassen fünf 
Publikationen zwei Experimente oder sind in zwei Teilstudien aufgesplittet. Bei- 
spielsweise führen Van der Kaa und Krahmer (2014) und Jung et al. (2017) jeweils 
zwei Experimente mit gleichem Setting, aber unterschiedlichen Teilnehmenden 
durch: einmal mit Journalist:innen und einmal mit Teilnehmenden ohne journa- 
listischen Hintergrund. Hier können möglicherweise Rückschlüsse auf den Einfluss 


3 Für ausgeschlossene kommunikationswissenschaftliche Arbeiten sei exemplarisch Yao und 
Salmon (2017) angeführt. Yao und Salmon (ebd.) führen auch ein Online-Experiment mit 
Befragung zur Wahrnehmung computergenerierter Nachrichten durch. Das Paper wurde 2017 
lediglich auf einer studentischen Konferenz an der Nanyang Technological University in 
Singapore vorgestellt und wird deshalb im weiteren Verlauf nicht eingebunden. In der Arbeit 
wird darauf hingewiesen, dass die Studie als Vorbereitung für weitere Veröffentlichungen 
konzipiert ist (vgl. ebd.: 8). Womit die Publikation von Tandoc Jr. et al. (2020) gemeint sein 
dürfte. 


4 Die vollständige Analyse ist in Tabelle 9.3 im Anhang ‚Forschungsstand Rezeptionsstudien‘ 
dargestellt. 
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von journalistischem Hintergrundwissen oder journalistische Erfahrungen auf die 
Bewertung von automatisiert generierten Nachrichten gezogen werden, aber diese 
Teilstudien sind nicht Gegenstand der Erarbeitung des Forschungsstands zur Per- 
spektive der Rezipierenden und werden im Folgenden nicht berücksichtigt. Auch 
in den Arbeiten von Jia (2020), Waddell (2018), Haim und Graefe (2017) wer- 
den zwei, teilweise eigenständige, teilweise verbundene, Experimente durchgeführt, 
hier aber als reine Rezeptionsstudien. Somit werden aus diesen Arbeiten alle Daten 
berücksichtigt. Deshalb besteht der Forschungsstand aus insgesamt 15 relevanten 
Publikationen mit 18 (Teil-)Studien, im Folgenden wird von 15 Rezeptionsstudien 
gesprochen. 


5.2 Aufarbeitung des Forschungsstands zu 
Glaubwürdigkeit und Vertrauen 


Die Analyse der Studienkonzeptionen erfolgt in einer ausführlichen Form, um zum 
einen Forschungslücken für die vorliegende Arbeit und für Anschlussforschung aus- 
findig zu machen und zum anderen, um zu ermitteln, wie breit der Fundus an mögli- 
chen Einflussfaktoren auf die Vertrauenszuschreibung der Lesenden in automatisiert 
generierte Nachrichten ist. Die ausführliche Betrachtung der Studienkontexte ist 
außerdem notwendig, um die Validität und die Vergleichbarkeit der Studienergeb- 
nisse beurteilen zu können: Beispielsweise ist die Analyse der Sprache der verwen- 
deten Nachrichtentexte wichtig, um die externe Validität der Stimuli zu bewerten 
(vgl. dazu 5.2.2). Die Art der Rekrutierung der Proband:innen kann Aufschluss 
über weitere Einflussfaktoren geben, die nicht unmittelbar als Variablen operatio- 
nalisiert worden sind, wie das Mediensystem oder der kulturelle Hintergrund der 
Teilnehmenden. Der Schwerpunkt der Systematisierung der Rezeptionsstudien liegt 
im Folgenden — dem Ziel dieser Arbeit folgend — auf Vertrauen beziehungsweise 
Vertrauenswürdigkeit und die wahrgenommene Glaubwürdigkeit. 


5.2.1 Studienüberblick und Schwerpunkte ausgewählter 
Arbeiten 


Mehrheitlich sind die 14 Primärstudien als Online-Experimente mit anschließen- 
der Online-Befragung konzipiert und verwenden als Stimuli automatisiert gene- 
rierte beziehungsweise als automatisiert generiert gekennzeichnete Texte. Die Pro- 
band:innen sind jeweils Teilnehmende ohne journalistischen Hintergrund (vgl. Cler- 
wall 2014; Van der Kaa und Krahmer 2014; Jung et al. 2017; Haim und Graefe 2017; 
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Graefe, Haim etal. 2018; Wölker und Powell 2018; Waddell 2018; Zheng etal. 2018; 
Liu und Wei 2019; Melin et al. 2018; Wus 2020; Waddell 2019; Jia 2020; Tandoc Jr. 
et al. 2020). In die Aufarbeitung des Forschungsstands wurde zusätzlich die Sekun- 
däranalyse von Haim und Graefe (2018a) aufgenommen, die mit den Daten von 
Haim und Graefe (2017) arbeitet”. 

Die ersten Studien zur Bewertung computergenerierter Nachrichten werden 2014 
veröffentlicht (vgl. Clerwall 2014; Van der Kaa und Krahmer 2014), zwei weitere 
Publikationen folgen im Jahr 2017 (vgl. Jung et al. 2017; Haim und Graefe 2017), 
sechs Arbeiten erscheinen 2018 (vgl. Graefe, Haim et al. 2018; Haim und Graefe 
2018a; Wölker und Powell 2018; Waddell 2018; Zheng et al. 2018; Melin etal. 2018), 
zwei Arbeiten 2019 (vgl. Waddell 2019; Liu und Wei 2019) und drei Studien 2020 
(vgl. Wus 2020; Jia 2020; Tandoc Jr. et al. 2020). Interessant ist, dass sich auch 
die Studien von 2020 an den Arbeiten der früheren Jahren orientieren: Es haben 
sich zwar einzelne Bestandteile, z. B. die Hinzunahme von moderierenden oder 
vermittelnden Variablen, verändert, aber im Wesentlichen sind die Studiensettings 
gleichgeblieben. 

Durchgeführt werden Studien in den USA (vgl. Waddell 2018; Liu und Wei 2019; 
Wus 2020; Waddell 2019), Deutschland (vgl. Haim und Graefe 2017; Graefe, Haim 
etal. 2018), Schweden (vgl. Clerwall 2014), den Niederlanden (vgl. Van der Kaa und 
Krahmer 2014), Finnland (vgl. Melin et al. 2018), China (vgl. Jia 2020), Südkorea 
(vgl. Jung et al. 2017) und Singapur (vgl. Tandoc Jr. et al. 2020). Die Stimulitexte 
sind in der jeweiligen Amtssprache oder in der Muttersprache der Proband:innen 
verfasst. Zusätzlich legen Wölker und Powell (2018) eine länderübergreifende, 


> Haim und Graefe (2018a) analysieren insbesondere den neu eingeführten Einflussfaktor 
‘Involvement’ und liefern damit Ergebnisse für die weitere Exploration. Allerdings treten 
in der Studiendokumentationen Unklarheiten auf: Zunächst verweisen die Autoren auf Pri- 
märdaten einer Studie aus dem Jahr 2016 (vgl. ebd.: 189), im folgenden Text beziehen sich 
dann aber auf Haim und Graefe (2017) (vgl. Haim und Graefe 2018a: 196). Zudem besteht 
Haim und Graefe (2017) aus zwei Teilexperimenten, die zusammen N = 618 ergeben, in der 
Sekundäranalyse wird hingegen mit N = 624 gerechnet, und es ist nicht eindeutig ersichtlich, 
wie die Daten der beiden Teilexperimente in der Sekundäranalyse zusammengefasst werden. 
Unklar ist außerdem, wie die Sekundäranalyse auf ein 2x2x3-Studiendesign mit Manipulation 
der Quelle, der Kennzeichnung sowie der Themen verweisen kann (Haim und Graefe 2018a: 
196), da bei Haim und Graefe (2017) keine Manipulation der Kennzeichnung ersichtlich ist. 
Zudem operationalisieren Haim und Graefe (ebd.) die Wahrnehmung mit Glaubwürdigkeit, 
Lesbarkeit und Qualität wogegen Haim und Graefe (2018a) die Glaubwürdigkeit, Lesbarkeit 
und journalistische Expertise messen. 

6 Bei Jung et al. (2017) ist die Sprache des Experiments nicht dokumentiert. Da die automa- 
tisiert generierten Nachrichtentexte von einem Algorithmus in Südkorea produziert wurden 
und die menschlichen Texte von Journalist:innen, ist davon auszugehen, dass Stimuli und 
Fragebogen in Koreanisch vorlagen (vgl. ebd.: 294f.). 
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europaweite Studie an, wobei 227 der 300 Proband:innen aus Deutschland kommen 
(vgl. ebd.: 6). Stimuli und Fragebogen liegen in Englisch vor. Zheng et al. (2018) 
führen eine Ländervergleichsstudie mit USA und China durch, Stimuli und Fra- 
gebogen der chinesischen Proband:innen werden vom Englischen ins Chinesische 
übersetzt und in einem Review überprüft. Englisch ist Amtssprache in Singapur und 
wird von Tandoc Jr. et al. (2020) für ihr Experiment verwendet, obgleich sie doku- 
mentieren, dass die Mehrheit der Teilnehmenden Chines:innen sind und die Sprache 
des Experiments damit überwiegend nicht die Muttersprache der Proband:innen ist 
(vgl. dazu 5.2.2). 

Die Stichproben variieren zwischen N = 46 (vgl. Clerwall 2014: 524) und N =986 
(vgl. Graefe, Haim et al. 2018: 8). Der Median aller Studien liegt bei 307 Teilneh- 
menden. Das Durchschnittsalter ist 34 Jahre und der Anteil weiblicher Probanden 
liegt durchschnittlich bei 56 Prozent’. Rekrutiert werden die Proband:innen über- 
wiegend durch kommerzielle Online-Panels (darunter vier von acht durch Ama- 
zon Mechanical Turk). Die Teilnehmenden der deutschen Studien werden über 
das SoSci-Panel, ein nicht-kommerzielles Online-Panel, rekrutiert (vgl. Haim und 
Graefe 2017: 1050; Graefe, Haim et al. 2018: 8). Bei Clerwall (2014) sowie den 
chinesischen Proband:innen bei Zheng et al. (2018) handelt es sich um Studierende 
der Universitäten oder der Studiengängen der Autor:innen. Zwei weitere Experi- 
mente, die von Wölker und Powell (2018) sowie die von Jia.2020, verwenden ein 
Schnellball- beziehungsweise Empfehlungsverfahren und nutzen dazu europäische 
und chinesische Social-Network-Sites. Van der Kaa und Krahmer (2014) machen 
keine Angaben zur Rekrutierung. Demographische Merkmale wurden in allen Expe- 
rimenten berücksichtigt und zeigen keine Effekte bei der Bewertung der compu- 
tergenerierten Nachrichten. Lediglich Melin et al. (2018) stellen Unterschiede in 
gruppierten demografischen Merkmalen fest, so konnten junge Frauen computerge- 
nerierte Nachrichten weniger gut eindeutig zuordnen als ältere Männer (vgl. ebd.: 
43363)". 


Schwerpunkte und Besonderheiten ausgewählter Studien 

Neben dem Überblick über die Studien sei auf Schwerpunkte einzelner Arbei- 
ten hingewiesen, die bisher nicht oder nur kurz thematisiert wurden, die aber 
Auswirkung auf die Studienkonzeptionen haben, wichtig für die Einordnung der 


7 Es gibt Primärstudien in denen demographische Angaben fehlen, deshalb sei auf fehlende 
Werte und die vollständige Tabelle 9.3 im Anhang ‚Forschungsstand Rezeptionsstudien‘ im 
elektronischen Zusatzmaterial hingewiesen. 

8 Ausführlicher in Abschnitt 5.2.4. In einigen Arbeiten wurden neben demographischen Merk- 
malen auch Angaben zum Mediennutzungsverhalten oder zu Vorkenntnissen der Automatisie- 
rung abgefragt, dies wird im Folgenden bei der Operationalisierung der Variablen thematisiert. 
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Studienergebnisse sind und Erkenntnisse zur weiteren Exploration des Forschungs- 
themas liefern. So fragen zu einen Clerwall (2014) und Melin et al. (2018) die 
Proband:innen bei nicht-gekennzeichneten Texten explizit nach dem vermuteten 
Textursprung, also danach, ob die vorliegenden Nachrichten menschlich verfasst 
oder algorithmisiert erzeugt sind”. Neben der Wahrnehmung von automatisiert gene- 
rierten Texten erheben Jia (2020), Waddell (2018), Graefe, Haim et al. (2018) und 
Haim und Graefe (2017) zusätzlich die Erwartungen an automatisierten Journalis- 
mus. Die Erwartung wird durch Befragungen vor Vorlage der Texte (vgl. Jia 2020: 
2617; vgl. Haim und Graefe 2017: 1051), durch gezielte Manipulation von Quelle 
und Kennzeichnung der Stimuli in den Experimenten (vgl. Graefe, Haim et al. 2018: 
7f.) sowie durch die nach dem Lesen des Stimulus gestellte Frage, ob die Erwartun- 
gen erfüllt wurden, ermittelt (vgl. Waddell 2018: 245). Weiterhin legen Jia (2020), 
Wus (2020), Haim und Graefe (2017), Graefe, Haim et al. (2018) und Melin et al. 
(2018) in ihren Experimenten Wert darauf, dass Lesende einen bewussten bezie- 
hungsweise unbewussten Vergleich zwischen menschlich verfassten und maschi- 
nengeschriebenen Texten ziehen können. Die Autor:innen können damit teilweise 
aufzeigen, dass sich durch den Textvergleich die Wahrnehmung der Teilnehmenden 
verändert. Insbesondere Jung et al. (2017), Zheng et al. (2018) und Wölker und 
Powell (2018) weisen darauf hin, dass zwischen Mediensystemen, Kulturen und 
Ländern Unterschiede bestehen können und in der Forschung berücksichtigt wer- 
den müssen. Jung et al. (2017) führen eine Studie in Südkorea, da sie - im Vergleich 
zu den bisherigen Studienergebnissen der europäschen Studien — hier eine ganz 
andere öffentliche Meinung bezogen auf Journalismus und Technologie wahrneh- 
men: In Südkorea sind Journalist:innen ihrer Ansicht nach sehr schlecht angesehen, 
was unter anderem auf Medienskandale und einem daraus resultierendem geringem 
Vertrauen gegenüber Journalist:innen begründet liegt. Neue Technologien werden 
aber sehr offen angenommen, es herrscht eine hohe Technologieaufgeschlossenheit. 
Für Europa beschreiben die Autor:innen gegenteilige Standpunkte: Journalismus 
allgemein und Journalist:innen genießen ein höheres Ansehen und das Vertrauen in 
ihre Arbeit ist grundsätzlich höher, Technologie und Automatisierung werden aber 
zunächst skeptisch betrachtet. Die Bevölkerung in Europa gilt in diesem Punkt als 
wenig aufgeschlossen. Jung et al. (ebd.) vergleichen ihre Ergebnisse wiederholt mit 
den bis dato erschienenen europäischen Studien und führen so Kultur (im Sinne 
der Haltung Journalist:innen gegenüber und Technologieaufgeschlossenheit) ein. 
Auch Zheng et al. (2018) legen einen Schwerpunkt auf den Ländervergleich und 


? Die Studienergebnisse werden nach der Betrachtung der Variablen zusammengefasst, 
vgl. 5.2.4. An dieser Stelle sei aber vorgegriffen: Die Lesenden können die Textquelle nicht 
zuverlässig und eindeutig zuordnen. 
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verwenden kulturellen Hintergrund als unabhängige Variable; Wölker und Powell 
(2018) konzipieren zudem eine länderübergreifende europaweite Studie. 


5.2.2 Umsetzung und Verwendung der Stimuli 


Wie ausgeführt ist der Aufbau der Online-Experimente ähnlich: Es gibt einen 
(oder mehrere) Stimuli aus einem computergenerierten und/oder von einem Men- 
schen verfassten Nachrichtentext. Anschließend findet eine Befragung mit Hilfe 
eines standardisierten Online-Fragebogens zur Wahrnehmung und Bewertung der 
Texte statt. Es kommen sowohl ein- also auch mehrfaktorielle Konzeptionen zum 
Einsatz und es gibt weiterhin in-between-subject-Designs sowie within-subject- 
Anordnungen sowie Kombinationen davon (vgl. Tabelle 9.3 im Anhang ‚For- 
schungsstand Rezeptionsstudien‘ im elektronischen Zusatzmaterial). 

Insgesamt lesen die Teilnehmenden in elf Teilexperimenten einen Text (vgl. 
Tandoc Jr. et al. 2020; Waddell 2019; Liu und Wei 2019; Zheng et al. 2018; Waddell 
2018; Haim und Graefe 2017; Jung et al. 2017; Van der Kaa und Krahmer 2014; 
Clerwall 2014), in vier Teilstudien je zwei Texte (vgl. Wus 2020; Wölker und Powell 
2018; Graefe, Haim et al. 2018; Haim und Graefe 2017) und in den weiteren zwei 
weiteren Primärstudien vier beziehungsweise acht Texten bei Jia (2020) und 14 
Nachrichten bei Melin et al. (2018)!®. In den zwei weiteren Primärstudien sind 
es bei Jia (2020) vier beziehungsweise acht Texte und bei Melin et al. (2018) 14 
Nachrichten. Die Menge an insgesamt verwendeten Stimuli variiert in den Studien 
zwischen zwei bis 24 Texten (vgl. z. B. Clerwall 2014; Liu und Wei 2019). Wenn 
mehrere Texte verwendet werden, konnten die Teilnehmenden in vier Studien einen 
Vergleich zwischen computergenerierten und menschlich verfassten Texten ziehen 
(vgl. Jia 2020; Wus 2020; Melin et al. 2018; Haim und Graefe 2017). In sechs von 
acht Experimentalgruppen ist auch bei Graefe, Haim et al. (2018) ein Vergleich 
möglich. Bei Haim und Graefe (2017) findet dieser Vergleich für die Lesenden 
bewusst statt, indem die Stimuli entsprechend gekennzeichnet waren. Bei Jia (2020), 
Melin et al. (2018) hingegen erfolgt der Vergleich unbewusst. Eine Kombination aus 
bewussten und unbewussten Vergleichen ist in den Studien von Wus (2020), Graefe, 
Haim et al. (2018) in unterschiedlichen Experimentalgruppen angelegt. Wie noch 
auszuführen ist, gehen Jia (2020), Haim und Graefe (2017) in der Auswertung 
explizit auf den Vergleich beider Textarten ein. 


10 Die Sekundäranalyse von Haim und Graefe (2018a) wird aufgrund der unklaren Studien- 
dokumentation nicht berücksichtigt. 


5.2 Aufarbeitung des Forschungsstands zu Glaubwürdigkeit und Vertrauen 113 


Umsetzung der unabhängigen Variablen: Textquelle, Quellenkennzeichnung 
und Nachrichtenthema 
Für die Erzeugung der Stimuli nutzen die Autor:innen drei Quellen: von Jour- 
nalist:innen geschriebene Nachrichten, algorithmisch generierte Texte sowie eine 
Kombination beider Verfahren, so genannte hybride Textquellen. Insgesamt werden 
die Stimuli entweder eigens für die Experimente generiert, bestehende Nachrich- 
tentexte von den Forschenden angepasst oder die Texte werden ohne Veränderung 
zum Beispiel von Online-Publikationen übernommen. Teilweise finden sich in den 
Dokumentationen detaillierte Erläuterung woher, insbesondere die algorithmisiert 
erzeugten, Texte stammen und zum Teil sind die Stimuli in Gänze in den Anhän- 
gen einsehbar. In neun Primärstudien sowie in der Sekundäranalyse werden die 
Stimuli, die als automatisierte generierte Texte verwendet werden, auch tatsächlich 
von Algorithmen erzeugt (vgl. Jia 2020; Wus 2020; Melin et al. 2018; Wölker und 
Powell 2018; Graefe, Haim et al. 2018; Haim und Graefe 2017; Jung etal. 2017; Van 
der Kaa und Krahmer 2014; Clerwall 2014; Haim und Graefe 2018a). Die weite- 
ren Publikationen nutzen dazu menschlich verfasste Texte, die als algorithmisiert 
erzeugte Stimuli gekennzeichnet werden. Zur Erstellung der computergenerierten 
Texten werden entweder Algorithmen verwendet, die aus wissenschaftlichen oder 
forschungsnahen Projekten stammen (vgl. Van der Kaa und Krahmer 2014; Jung 
et al. 2017; Graefe, Haim et al. 2018; Melin et al. 201 gl! oder die von kommerziel- 
len Softwareanbietern erzeugt (vgl. Wölker und Powell 2018) und teilweise explizit 
für die Forschung zur Verfügung gestellt werden (vgl. Haim und Graefe 2017). 
Oder aber es werden Stimuli verwendet, die als algorithmisiert gekennzeichneten 
Nachrichten zum Beispiel auf Online-Newsseiten frei verfügbar waren (vgl. Cler- 
wall 2014; Jia 2020) oder deren Quelle nicht weiter erläutert wird (vgl. Wus 2020: 
1015). Die menschlich verfassten Stimuli stammen aus öffentlich zugänglichen 
Quellen oder werden eigens für die Experimente von Journalist:innen produziert. 
Neben der Verwendung verschiedener Textquellen gibt es in den Studien unter- 
schiedliche Ansätze die Urheberschaft der Texte, also maschinengeschriebene, 
menschlich verfasste oder hybride Autorenschaft, zu kennzeichnen. Die verschie- 
denen Quellenkennzeichnungen der Stimuli decken sich mit den Vorgehenswei- 
sen zur Kennzeichnung der Nachrichtentexte, wie sie in der Praxis vorzufinden 
sind (vgl. Abschnitt 3.3.3). Zunächst gibt es mit Clerwall (2014), Jia (2020) zwei 
Experimente, die keine Textquelle angeben. Beide verwenden sowohl menschlich 


11 Melin et al. (2018) nutzen ein kombiniertes Vorgehen: Hier wird der Algorithmus ‘Vlatteri’, 
der zu wissenschaftlichen Zwecken programmiert wurde, mit Daten aus finnischen Regional- 
wahlen trainiert. Der Algorithmus erzeugt für das Experiment zehn Berichte. Mit der gleichen 
Datengrundlage schreiben ein Journalist und eine Journalistin jeweils fünf weitere Nachrich- 
tentexte (vgl. ebd.: 43359). 
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verfasste als auch algorithmisiert erzeugte Texte, der Textursprung ist für die Pro- 
band:innen nicht erkennbar. Bei der Mehrheit der Rezeptionsstudien verwenden 
die Forschenden sowohl korrekt gekennzeichnete als auch manipulierte Kennzeich- 
nungen!? (vgl. Liu und Wei 2019; Zheng et al. 2018; Waddell 2018; Graefe, Haim 
et al. 2018; Jung et al. 2017; Van der Kaa und Krahmer 20143. Manipulierte Kenn- 
zeichnungen werden entweder zielgerichtet verwendet, um mithilfe von in-between- 
subject-Verfahren einzelne Variablen zu testen oder sind zweckmäßig im Einsatz, 
um einen größeren Korpus an Stimuli zu erzeugen, wenn kein Rückgriff auf tatsäch- 
lich algorithmisiert generierte Texte möglich ist (vgl. zum Beispiel Tandoc Jr. et al. 
2020; Liu und Wei 2019). Außerdem konzipiert Wus (2020) sowohl Experimen- 
talgruppen ohne gekennzeichnete Stimuli als auch Gruppen mit wahrheitsgemäß 
gekennzeichneten Texten. Zwei weitere Arbeiten verwenden nur korrekte Kenn- 
zeichnungen (vgl. Wölker und Powell 2018; Haim und Graefe 2017) und noch zwei 
weitere nur manipulierte Verfasser:innenzeilen (vgl. Tandoc Jr. et al. 2020; Waddell 
2019)!*, Abschließend sei noch die Arbeit von Melin et al. (2018) als Sonderfall 
hinsichtlich der Kennzeichnung dargestellt. Hier liegen den Proband:innen mehrere 
Stimulitexte mit unterschiedlichen Varianten der Kennzeichnung vor, aus denen sie 
frei wählen können. Zudem legen die Autor:innen Wert auf eine geschlechtsneutral 
formulierte Autor:innenzeile gelegt, um weitere Störvariablen auszuschließen (vgl. 
auch Zheng et al. 2018: 269). 

Wenn Texte gekennzeichnet werden, dann überwiegend unter der Überschrift bei 
Angabe der Verfasser:in (so genannte Autoren- oder Verfasserzeile, engl.: byline). 
In einigen Arbeiten wird auch doppelt gekennzeichnet, das heißt sowohl in der 
Autorenzeile am Textanfang als auch am Ende beziehungsweise unter dem Nach- 
richtentext (auch als Endnote bezeichnet). Teilweise finden sich in der Endnote wei- 
tere Erläuterungen zur Funktionsweise der der Entstehung des Algorithmus (vgl. 
zum Beispiel Tandoc Jr. et al. 2020: 554; Wölker und Powell 2018: 7). Zudem gibt 
es Studien, wie Waddell (2018), Zheng et al. (2018) und Liu und Wei (2019), bei 


12 Korrekte Kennzeichnung bedeutet, dass algorithmisiert erzeugte, menschlich verfasste oder 
hybride Texte auch als solche gekennzeichnet und die Textquelle für die Lesenden ersichtlich 
ist. In den Studien, in denen die Kennzeichnung manipuliert wurde, werden maschinenge- 
schriebene Texte als menschlich verfasste Nachrichten angegeben oder journalistische Texte 
als computergeneriert gekennzeichnet. 

13 Auch Haim und Graefe (2018a) geben an, dass sowohl korrekte als auch manipulierte 
Kennzeichnungen verwendet werden. Wobei dies nicht logisch erscheint, da sich die Sekun- 
däranalyse auf die Primärdaten von Haim und Graefe (2017) bezieht und diese laut Studien- 
dokumentation nur mit korrekten Kennzeichnungen arbeiten. 

14 Bei Waddell (2019) ist die Quelle der Texte nicht eindeutig dokumentiert, es werden „multi- 
ple news articles“ (ebd.: 87) ausgewählt und es ist davon auszugehen, dass hier rein menschlich 
verfasste Texte ausgewählt wurden. 
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denen ein Manipulationscheck eingeführt wurde (so genannte Kennzeichnungserin- 
nerung), also die Frage, ob die Proband:innen die jeweilige Kennzeichnung gelesen 
haben und sich an den Verfasser:in erinnern können. Nur wenn die richtige Quellen- 
angabe zugeordnet werden kann, hat beispielsweise Waddell (2018) die Ergebnisse 
der Befragung in die Auswertung aufgenommen. 

Die Themen der Stimulitexte ähneln sich in den 15 Rezeptionsstudien: Es werden 
immer Nachrichten mit einer hohen Daten- und Informationsdichte verwendet. Ins- 
gesamt werden in zehn Publikationen regionale oder überregionale Sportberichte 
ausgewählt, neun Studien verwenden Finanz- und Börsentexte, fünfmal werden 
lokale und überregionale Politiknachrichten vorgelegt sowie dreimal sonstige lokale 
und regionale Nachrichten!?. Zwei Stimuli haben zudem Wissenschaft und Ver- 
anstaltungen zum Thema (vgl. Waddell 2018: 244; Jia 2020: 2617). Außerdem 
nutzen Haim und Graefe (2017) und damit auch Haim und Graefe (2018a) einen 
Boulevardbericht. Die Auswahl der Texte erfolgt unter Berücksichtigung der Text- 
länge, der Vergleichbarkeit zwischen automatisiert generierten und menschlich ver- 
fassten Texten, aufgrund der Objektivität der Texte oder einem möglichst geringen 
Themeninvolvement (vgl. z. B. Liu und Wei 2019: 643f., Haim und Graefe 2017: 
1050). Weitere Studien berücksichtigen die Medienorganisation, aus deren Publika- 
tionen die Auswahltexte stammen. Hier wird versucht, den Einfluss von Boulevard- 
und Qualitätsmedien oder den Vergleich zwischen traditionellen Zeitungshäusern 
und Online-Medien zu kontrollieren (vgl. Liu und Wei 2019: 643; Waddell 2018: 
239, 244; Zheng et al. 2018: 269). Bei der Auswahl der Stimuli ist insgesamt eine 
Mischung an unterschiedlichen Nachrichtentexten zu sehen, bei denen Sport- und 
Finanzberichte überwiegen. Dies ist mit den Anwendungsgebieten des automati- 
sierten Journalismus vergleichbar (vgl. Kapitel 3). Zudem kann die Entwicklung 
der NLG-Technologie in der Berichterstattung und die Ausweitung der Themenge- 
biete auch in der Forschung beobachtet werden, so überwiegen in den Studien der 
Jahre 2014 bis 2018 die Sport- und Finanzberichte, ab 2018 ist eine Ausweitung 
der Themen zu beobachten. 


!5 Als Stimuli der sonstigen lokalen und regionalen Nachrichten werden eine Erdbeben- 
Eilmeldung (vgl. Zheng et al. 2018), zwei lokale Staumeldungen (vgl. Jia 2020), ein Bericht 
über ein Erdbeben im Nachbarstaat (vgl. ebd.) sowie eine Wettermeldung (vgl. Waddell 2018) 
verwendet. 

16 Waddell (ebd.) hat einen Text über ‘science’ (vgl. ebd.: 244) ausgewählt, ohne den Text 
aber näher zu spezifizieren und Jia (2020) legt den Proband:innen einen Bericht über eine 
Konferenz mit den Höhepunkten der jeweiligen Vorträge vor (vgl. ebd.: 2617). 
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Validität der Stimuli und Zwischenfazit zur vorliegenden Arbeit 

Zur Einordnung der externen Validität der Stimuli sind drei Aspekte wichtig: 
Zunächst ist A) die Validität der eigens für die Experimente angefertigten Texte 
kritisch zu beurteilen, insbesondere wenn die Algorithmen im Forschungsumfeld 
erzeugt und nicht (ausschließlich) für journalistische Zwecke trainiert sind. Außer- 
dem gibt es B) in der Praxis keine Kennzeichnungsregelungen für automatisiert 
generierte oder hybrid erzeugte Nachrichten. Es kann also nicht davon ausgegan- 
gen werden, dass ein nicht-gekennzeichneter oder als menschlich gekennzeichneter 
Text auch tatsächlich menschlich verfasst ist und vice versa, dass computergenerierte 
Texte vollständig ohne menschliche Korrektur oder dergleichen publiziert wurden. 
Laut den Studiendokumentationen und den beschriebenen Validitätsprüfungen kann 
zwar in der Regel von einer hohen externen Validität ausgegangen werden, dennoch 
müssen diese Aspekte unter anderem bei der Aussagekraft der Ergebnisse berück- 
sichtigt werden. Außerdem zeigen zwar C) mehrere Studien, dass Lesende nicht 
eindeutig zuordnen können, ob Nachrichten computergeneriert oder menschlich 
verfasst sind (vgl. Abschnitt 5.2.4). Allerdings muss kritisch hinterfragt werden, ob 
in Studien, in denen die Bewertung von computergenerierten Texten im Mittelpunkt 
steht, menschlich verfasste Texte, die lediglich falsch manipuliert gekennzeichnet 
sind, geeignete und valide Stimuli darstellen!” . In weiteren Arbeiten wird weiterhin 
diskutiert, ob D) das Sprachniveau der Proband:innen im Zusammenhang mit den 
verwendeten Stimulitexten steht und sich die Wahrnehmung computergenerierter 
Nachrichten verändert, wenn die Texte in der Muttersprache der Teilnehmenden 
vorliegen (vgl. Jia 2020: 2623). 

Im Unterschied zu den Rezeptionsstudien legt die vorliegende Arbeit weni- 
ger Wert auf die Betrachtung einzelner computergenerierter Artefakte, sondern 
abstrahiert das Bezugsobjekt der Wahrnehmung auf automatisierten Journalismus 
als Ganzes. In den Focus Groups werden den Teilnehmenden deshalb zwar Bei- 
spiele für automatisierte Berichterstattung vorgelegt, es geht aber vielmehr um 
eine Veranschaulichung des Themas und nicht um die konkrete Bewertung der 
einzelnen Stimuli. Für die Exploration der Vertrauenszuschreibung im automati- 
sierten Journalismus ist die Aufarbeitung der Rezeptionsstudien aber wichtig: In 
der unterschiedlichen Umsetzung der Studien können weitere Forschungsideen 
sowie zusätzliche Einflussfaktoren auf die Wahrnehmung, die Vertrauensbewertung 
und den Umgang mit automatisiert erzeugten Texten generiert werden. Die vorlie- 
gende Arbeit berücksichtigt beispielsweise den Einfluss des Nachrichtenthemas, die 


17 Wie bei den Studienkonzeptionen besprochen gibt es fünf Arbeiten, in denen mensch- 
lich verfasste Texte als computergenerierte Stimuli verwendet werden, indem für die Pro- 
band:innen lediglich die Kennzeichnung der Texte verändert wurden. 
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Quellenkennzeichnung, die journalistische Darstellungsform und die Medienpubli- 
kation. Dies aber bezogen auf ein generalisiertes Bezugsobjekt und weniger auf 
konkret verwendete Stimuli. 


5.2.3 Operationalisierung der Variablen 


Eine vollständige Auflistung der verwendeten Variablen ist in Tabelle 9.3 im Anhang 
‚Forschungsstand Rezeptionsstudien‘ im elektronischen Zusatzmaterial dargestellt. 
Im Folgenden soll es vielmehr um eine aussagekräftige Zusammenfassung der Ope- 
rationalisierung und Schwerpunkte der verwendeten Variablen gehen. Dazu werden 
zunächst die unabhängige Variablen, danach die vermittelnden und moderieren- 
den Variablen sowie die abhängigen Variablen besprochen. Abschließend folgt die 
Zusammenfassung zum Schwerpunkt Vertrauen beziehungsweise Vertrauenswür- 
digkeit. Die Studienergebnisse werden im Anschluss ab Abschnitt 5.2.4 thematisiert. 


Unabhängige Variablen: Textquelle, Kennzeichnung und Thema 

Mit den Rezeptionsstudien wird untersucht, ob und wenn ja in welchem Umfang 
die Textquelle, die Kennzeichnung der Texte und das Nachrichtenthema Einfluss 
auf die Bewertung und Wahrnehmung von computergenerierten Texten haben. Die 
konkrete Umsetzung der Variablen und Stimuli wurde in Abschnitt 5.2.3 aufgelistet. 
Insgesamt nutzen nicht alle Studien alle drei unabhängige Variablen und zudem sind 
vereinzelt zusätzliche Prediktoren verwendet worden, wie die bewertete Objektivität 
der Texte (vgl. Tandoc Jr. et al. 2020). Außerdem führen Zheng et al. (2018) den 
kulturellen Hintergrund und die bewertete Glaubwürdigkeit der Publikation als 
weitere unabhängige Variable ein'®. 


Vermittelnde und moderierende Variablen sowie Kontrollvariablen 
Zusätzlich zu den unabhängigen Variablen werden in einigen Arbeiten Faktoren 
getestet, die möglicherweise vermittelnden oder moderierenden Einfluss!” haben. 


18 Der kulturelle Hintergrund wird mit den Ausprägungen Low-Kontext-Kultur und High- 
Kontext-Kultur eingeführt. Bei der Publikation unterscheiden die Autor:innen in glaubwür- 
dige und nicht-glaubwürdige Publikation (vgl. Zheng et al. 2018: 269). Weiterhin werden 
Robot-Recall (vgl. Waddell 2018), Publikation und Thema (vgl. Waddell 2019: 88 f.) als 
unabhängige Variablen beschrieben. In der Dokumentation beider Arbeiten werden alle drei 
Faktoren aber als Moderationsvariablen getestet und ausgewertet und deshalb im Folgenden 
auch als moderierende Variablen geführt. 


19 Vermittelnde Variablen (engl.: mediating variables) sind zwischen der unabhängigen und 
der abhängigen Variable angeordnet und erklären die Beziehung zwischen beiden Variablen. 
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Als vermittelnde Variablen getestet worden sind: Quellen-Antropomorphismus 
(vgl. Waddell 2018, 2019), Nachrichtenbias (vgl. Waddell 2019), Maschinenheu- 
ristik (vgl. Waddell 2018), die Nichteinhaltung beziehungsweise Enttäuschung von 
Erwartungen an automatisierten Journalismus und das Thema der Nachrichtentexte 
(vgl. ebd.) sowie die Text- und Quellenglaubwürdigkeit” (vgl. Wölker und Powell 
2018). Mit Quellen-Anthropomorphismus wird erhoben, inwiefern die Teilnehmen- 
den den Verfassern der Stimuli menschliche Eigenschaften zuschreiben (vgl. Wad- 
dell 2018: 245; Waddell 2019: 89) und mit Nachrichtenbias ist die Wahrnehmung 
oder das Erkennen von Bias oder Vorurteilen in den Medien durch die Lesenden 
gemeint (vgl. Waddell 2019: 89)?!. Heuristiken sind weiterhin analytische Vorge- 
hensweisen, mit Hilfe derer man unter begrenzten Voraussetzungen (zum Beispiel 
Wissen oder Zeit) Entscheidungen treffen und zu sinnvollen Lösungsstrategien fin- 
den kann. Das Konzept der Maschinenheuristik basiert auf Sundar (2008) und meint, 
dass bestimmte Hinweise digitaler Medien bei den Konsument:innen Heuristiken 
auslösen und ihre Qualitäts- und Glaubwürdigkeitsbewertung beeinflussen. 

Als moderierende Variablen getestet werden die Publikation (vgl. Liu und Wei 
2019; Waddell 2019)”, die journalistische Darstellungsform (vgl. Liu und Wei 


Moderierende Variablen (engl.: moderating variables) wirken auf die Beziehung zwischen 
unabhängigen und abhängigen beziehungsweise vermittelnden Faktoren, indem sie den Effekt 
des Prediktors verändern. 


20 Das Thema der Stimuli wird in der Regel als unabhängige Variable konzipiert und die Text- 
und Quellenglaubwürdigkeit fungiert als abhängige Variable (vgl. Abschnitt 5.2.3). Zusätz- 
lich testen Wölker und Powell (2018), inwiefern die bewertete Text- und Quellenglaubwürdig- 
keit von automatisiert generierten Inhalten Einfluss auf die Entscheidung der Lesenden hat, 
entweder automatisiert generierten oder menschlich verfasste Nachrichten zu konsumieren. 
Deshalb ist Kennzeichnung als unabhängige, die Selektivität die abhängige, und Text- und 
Quellenglaubwürdigkeit als vermittelnde Variable konzipiert (vgl. ebd.: 5,11). 

21 Waddell (2019) verwendet Quellen-Anthropomorphismus und Nachrichtenbias zudem als 
abhängige Variable (ebd.). 

22 Liu und Wei (2019) meinen mit Publikation die Glaubwürdigkeit der Medienorgani- 
sation, die die Nachricht veröffentlicht und operationalisieren diese mit den Ausprägung 
Fox News und New York Times (vgl. ebd.: 640). Sie konnten Moderationseffekte aufzei- 
gen. Waddell (2019) unterscheidet hingegen in traditionelle Publikationen sowie Online- 
Veröffentlichungen und konnte keinen Einfluss der Publikation feststellen (vgl. ebd.: 10f.), 
vgl. ausführlich 5.2.4. 
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2019)”, das Interesse am Thema oder auch Themeninvolvement genannt”* (vgl. 
Haim und Graefe 2018a), das Thema (vgl. Waddell 2019), die Vorkenntnisse zum 
automatisierten Journalismus und der Medienkonsum zu den Themen der Stimuli?” 
(vgl. Wölker und Powell 2018) sowie der Robot-Recall (vgl. Waddell 2018). Mit 
Robot-Recall ist gemeint, inwiefern die Wahrnehmung der Lesenden durch eine 
zuvor rezipierte Mediendarstellung von Robotern beeinflusst wird, also die Frage 
ob sich die Proband:innen an einen Film, eine Serie oder sonstige Medieninhalte 
erinnern können, in welchem ein Roboter als Haupt- oder Nebenfigur dargestellt 
wurde (vgl. ebd.: 243). 

In allen 15 Arbeiten werden demographische Merkmale erhoben, unter ande- 
rem um Störfaktoren möglichst ausschließen beziehungsweise kontrollieren zu 
können. Dazu sei zudem auf die unterschiedlichen Studiensettings verwiesen, mit 


23 Liu und Wei (2019) unterscheiden informierende und kommentierende Darstellungsfor- 
men (im Original „high-interpretation news“ (ebd.: 643)). Alle Texte behandeln politische 
und emotionale Themen, wie Obamacare, LGBT-Rechte und die Aufnahme von Geflüchte- 
ten. Die Stimuli unterscheiden sich in der Textlänge und dem Grad beziehungsweise Umfang 
der Interpretation, aber nicht im sprachlichen Stil. Bei den informierenden Nachrichten (engl.: 
spot news) werden reine Fakteninformationen geliefert und die Texte sind vergleichsweise 
kurz. Für die kommentierenden Stimuli wird die Sachinformation im Text um Hintergrund- 
wissen sowie die Abwägung von Argumenten erweitert (ebd.: 642f.). Damit ist ein höheres 
Maß an Interpretation möglich und die Texte sind länger (vgl. ebd.: 643f.). In der Befragung 
wurde das Level der Interpretation operationalisiert durch die Items: „sophisticated, deep, 
interpretative, thoughtful, meaningful, and analyticalgrgq (ebd.: 645). Es konnten teilweise 
Moderation- oder Interaktionsseffekte nachgewiesen werden, siehe ausführlich 5.2.4. 


24 Themeninvolvement könnte, so die Autoren, die Wahrnehmung computergenerierte Texte 
auf zwei Arten beeinflussen: Zunächst wird vermutet, dass Menschen, die mit einem Thema 
vertraut sind und dazu in hohem Umfang Nachrichten konsumieren, höhere Ansprüche an 
diese Texte stellen. Gegenteilig könnte man annehmen, dass ein hohes Themeninvolvement 
dazu führt, dass nur die reinen Sachinformationen für die Lesenden interessant ist und sie 
weniger Wert auf sprachliche Formulierungen und Erläuterungen legen. Die Autoren testen 
deshalb sowohl einen Moderationseffekt auf die Beziehung der Textquelle und der Wahr- 
nehmung computergenerierter Texte sowie einen Effekt auf die Wahrnehmung in Bezug auf 
die Kennzeichnung der Texte. Gemessen wird Involvement durch je drei Wissensfragen pro 
Stimulithema. In der Auswertung konnten keine signifikanten Moderationseffekte festgestellt 
werden (vgl. Haim und Graefe 2018a: 200). 


25 Die Forschenden erheben die Vorkenntnisse zum automatisierten Journalismus in den Aus- 
prägungen ‘high knowledge’ und ‘low knowledge’. Auch der Medienkonsum zu den Themen 
der Stimulitexte wird dichotom in ‘high consumption’ und ‘low consumption’ (vgl. Wöl- 
ker und Powell 2018: 10) erfasst und analysiert. Den möglichen Einfluss der moderierenden 
Variablen beschreiben die Autor:innen bei der dritten Hypothese, die den Einfluss der Glaub- 
würdigkeitsbewertung (als vermittelnde Variable) auf die Nachrichtenauswahl (oder Selek- 
tivität, Konzipiert als abhängige Variable) und der Kennzeichnung als unabhängige Variable 
analysiert (vgl. ebd.: 5). 
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denen versucht wurde, mögliche Störvariablen zu minimieren (vgl. Abschnitt 5.2.3). 
Zusätzlich werden in einigen Arbeiten Faktoren berücksichtigt, die als Kontroll- 
variablen in Frage kommen. Dies sind Mediennutzungsverhalten beziehungsweise 
Nachrichtenkonsum (vgl. Tandoc Jr. et al. 2020; Graefe, Haim et al. 2018; Melin 
et al. 2018). Zudem erfragen Liu und Wei (2019), Graefe, Haim et al. (2018) das 
Themeninvolvement. Liu und Wei (2019) nutzen Politiknachrichten als Stimuli und 
fragen deshalb auch die politische Einstellung der Proband:innen ab. Außerdem wer- 
den die Vorerfahrungen mit automatisierter Berichterstattung bei Tandoc Jr. et al. 
(2020), Melin et al. (2018) und Jia (2020) berücksichtigt. Graefe, Haim et al. (2018) 
fragen weiterhin nach dem journalistischen Hintergrundwissen der Teilnehmen- 
den. Auf Seiten der Stimuli werden als Kontrollvariablen die Nachrichtenthemen 
(vgl. Zheng et al. 2018; Haim und Graefe 2018a; Van der Kaa und Krahmer 2014), 
die Art der algorithmischen und hybriden Kennzeichnung (vgl. Waddell 2019), die 
Reihenfolge der Stimulitexte, die wahrgenommene Wichtigkeit der Erhebungskrite- 
rien für die Teilnehmenden und die Zuordnenbarkeit der Quelle (vgl. Melin et al. 
2018) verwendet. Als Manipulationschecks nutzen Liu und Wei (2019), Zheng et al. 
(2018) und Waddell (2018) die Kennzeichnungserinnerung, also die Frage, ob die 
Teilnehmenden die angegebene Quelle der Texte wiedergeben können. 


Abhängige Variablen: Glaubwürdigkeit, Fachkenntnis und Lesbarkeit 

Die Rezeptionsstudien untersuchen die Wahrnehmung automatisiert generierter 
Nachrichtentexte und operationalisieren diese durch die bewertete Glaubwürdigkeit, 
Fachkenntnis, Lesbarkeit (engl.: credibility, expertise, readability) sowie teilweise 
durch zusätzliche abhängige Variablen”. Die Mehrheit der Arbeiten, dreizehn der 
15 Publikationen erfassen die wahrgenommene Glaubwürdigkeit als eine Dimen- 
sion der Wahrnehmung, arbeiten aber mit jeweils unterschiedlichen Fragen und 
Items (vgl. Clerwall 2014; Jung et al. 2017; Haim und Graefe 2017; Graefe, Haim 
et al. 2018; Wölker und Powell 2018; Waddell 2018; Liu und Wei 2019; Melin 
et al. 2018; Wus 2020; Waddell 2019; Jia 2020; Tandoc Jr. et al. 2020). Die zwei 
davon abweichenden Untersuchungen von Zheng et al. (2018) und Van der Kaa und 
Krahmer (2014) verwenden vergleichbare Konzepte und erheben die Vertrauens- 
würdigkeit (vgl. Van der Kaa und Krahmer 2014: 2f.) oder die wahrgenommene 
Textqualität sowie die Vorliebe für Nachrichtentexte (vgl. Zheng et al. 2018: 269 f.). 
Als weitere abhängige Variablen verwendet werden verschiedene Qualitätsbegriffe 


26 Jia (2020), Haim und Graefe (2018a) und Graefe, Haim et al. (2018) operationalisieren 
drei Dimensionen der Wahrnehmung, also Glaubwürdigkeit, Fachkenntnis und Lesbarkeit. 
Zwei weitere Arbeiten erfassen je zwei dieser Kategorien (vgl. Liu und Wei 2019; Haim und 
Graefe 2017), die verbliebenen zehn Studien untersuchen jeweils die Glaubwürdigkeit plus 
eine oder mehrere (Einzel-)Variablen. 
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(vgl. Melin et al. 2018; Zheng et al. 2018; Haim und Graefe 2017; Jung et al. 
2017), Konzeptionen von Medienvertrauen (vgl. Liu und Wei 2019; Zheng et al. 
2018; Van der Kaa und Krahmer 2014), die wahrgenommene Objektivität (vgl. Wus 
2020; Liu und Wei 2019) und Bias der Texte (vgl. Wus 2020; Waddell 2019), das 
Lesevergnügen (vgl. Melin et al. 2018), das emotionale Involvement, welches die 
Stimuli auslösen (vgl. Liu und Wei 2019), die Vorliebe für Nachrichtentexte (vgl. 
Zheng et al. 2018), die bewertete Wichtigkeit des Nachrichtenthemas (vgl. Waddell 
2018), die Wahrscheinlichkeit, einen automatisiert generierten oder einen mensch- 
lich verfassten Text auszuwählen (genannt Selektivität) (vgl. Wölker und Powell 
2018) sowie Quellen-Antropomorphismus (vgl. Waddell 2019)?’ und Repräsenta- 
tivität (Melin et al. 2018). Glaubwürdigkeit wird in den Studien vor allem durch 
die Quellen- und Textglaubwürdigkeit umgesetzt, lediglich Melin et al. (2018) und 
Wus (2020) beziehen auch die Mediumglaubwürdigkeit als abhängige Variable mit 
ein. 


Vertrauen und Vertrauenswürdigkeit im Schwerpunkt 

Von den 15 Rezeptionsstudien nehmen neun Arbeiten Bezug zu Vertrauen oder Ver- 
trauenswürdigkeit. Für sechs dieser neun Arbeiten ist Vertrauen beziehungsweise 
Vertrauenswürdigkeit ein Teil der Text-, Quellen- und Mediumglaubwürdigkeit (vgl. 
Tandoc Jr. et al. 2020; Jia 2020; Wus 2020; Wölker und Powell 2018; Graefe, Haim 
etal. 2018; Clerwall 2014). Vertrauen wird als einer von mehreren Items der Glaub- 
würdigkeit erhoben und bei der Operationalisierung beziehen sich die Autor:innen 
unter anderem auf Sundar (1999), Fogg und Tseng (1999), Newhagen und Nass 
(1989), Kohring (2004) und Kohring und Matthes (2007) (vgl. auch Abschnitt 4.3). 
Beispielsweise erheben Graefe, Haim et al. (2018) die Glaubwürdigkeit mit den 
vier Deskriptoren „accurate, trustworthy, fair and reliable“ (ebd.: 7) ab. 

Mit Liu und Wei (2019), Zheng et al. (2018) und Van der Kaa und Krahmer (2014) 
gibt es zudem drei Studien, die Vertrauen oder Vertrauenswürdigkeit nicht nur als 
einen Indikator der Glaubwürdigkeit, sondern als abhängige Variable in mindestens 
einer Hypothese oder Forschungsfrage verwenden. Für Van der Kaa und Krahmer 
(2014 sind Vertrauenswürdigkeit und Fachkenntnis essentielle Bestandteile der 
Glaubwürdigkeit automatisiert generierter Nachrichten. Vertrauenswürdigkeit wird 


27 Mit Quellen-Anthropomorphismus wird erhoben, inwiefern die Teilnehmenden den Verfas- 
sern der Stimuli menschliche Eigenschaften zuschreiben. Der Autor operationalisiert Quellen- 
Antropomormphismus im gleichen Paper sowie einer weiteren Arbeit als vermittelnde Varia- 
ble (vgl. Waddell 2018: 245; 2019: 89). 

28 Van der Kaa und Krahmer (2014) definieren nicht explizit eine Forschungsfrage sondern 
formulieren das Ziel der Arbeit mit „a more systematic look into the perceived trustworthiness 
and expertise of robot-written news article“ (ebd.: 2). 
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als Index mit den Indikatoren „reliability, honesty, accuracy, and factbased‘“ (ebd.: 
3) erhoben und bezieht sich unter anderem auch auf Fogg und Tseng (1999) und 
M. A. Hamilton (1998). Zheng et al. (2018) vergleichen die Bewertung computer- 
generierter Nachrichten von chinesischen und US-amerikanischen Proband:innen 
und wollen wissen, ob diese in der Nachrichtenproduktion Journalist:innen mehr 
vertrauen als Algorithmen oder umgekehrt (ebd.: 268). Die Forschungsfrage wird 
mit 16 Items umgesetzt und bezieht sich im Wesentlichen auf Kohring und Matthes 
(2007). Eine Auswahl der verwendeten Deskriptoren wurde veröffentlicht: “The 
topic of the news article receives the necessary attention;’ “The focus is on import- 
ant facts;’ “The reported information is true;’ and “The reporters’ opinions are well- 
founded’ (Zheng et al. 2018: 270). Weiterhin nehmen Liu und Wei (2019) die ‚Publi- 
kation‘ als erklärende Variable mit auf und untersuchen Moderationseffekte, die die 
wahrgenommene Vertrauenswürdigkeit der Publikation auf die wahrgenommene 
Vertrauenswürdigkeit der Textquelle”” bei automatisiert gekennzeichneten Nach- 
richten hat (ebd.: 645). 


Zwischenfazit zur Operationalisierung der verwendeten Variablen 

In den 15 Rezeptionsstudien steht die wahrgenommene Glaubwürdigkeit compu- 
tergenerierter Nachrichtentexte im Mittelpunkt. Vertrauen wird, wenn überhaupt 
thematisiert, mehrheitlich als Subdimension der Text- und Quellenglaubwürdigkeit 
operationalisiert. Die Systematisierung der Studien zeigt aber auch, dass Glaub- 
würdigkeit und Vertrauen — wie in Abschnitt 4.2.3 besprochen — eng verknüpfte 
Konzepte sind und beispielsweise zur Messung gleiche oder überlappende Skalen 
verwendet werden. Außerdem werden beide Begriffe auch im Forschungsstand nicht 
trennscharf voneinander abgegrenzt und teilweise synonym verwendet. Insgesamt 
bestätigt die Aufarbeitung die Befunde aus Kapitel 4: Die Verwendung des Glaub- 
würdigkeitsbegriff ist für die Rezeptionsstudien und ihren direkten Gegenstands- 
bezug sinnvoll und zielführend, für weiterführende und tiefergehende Auseinan- 
dersetzung bezogen auf ein generalisiertes Bezugsobjekt ist das Vertrauenskonzept 
aber geeigneter. 

Weiterhin zeigt die Aufarbeitung, dass die 15 Rezeptionsstudien in ihrem Aufbau 
grundsätzlich ähnlich sind, sich aber in Details unterscheiden. Zudem kann die Dar- 
stellung zeigen, dass, neben den wichtigsten unabhängigen Variablen der Textquelle, 
der Kennzeichnung der Quelle und der Nachrichtenthemen, weitere unabhängige, 


29 Die Vertrauenswürdigkeit der Quelle wird — sowohl für menschliche Verfasser:innen als 
auch für Maschinen - mit jeweils fünf Indikatoren abgefragt. Zwei dieser Deskriptoren werden 
in der Veröffentlichung als Gegensatzpaar „“Undependable — Dependable’ and ‘Dishonest 
— Honest“ (Liu und Wei 2019: 645) genannt. Grundlage dieser Operationalisierung sind 
McCroskey und Teven (1999) und Ohanian (1990). 
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moderierende und vermittelnde Variablen eingesetzt werden. Operationalisiert wer- 
den: 


1. unabhängige Variable: Textquelle, Quellenkennzeichnung, Nachrichtenthema, 
Objektivität der Texte bzw. Darstellungsform, Publikation, kultureller Hinter- 
grund 

2. moderierende Variable: Nachrichtenthema, Objektivität der Texte bzw. Darstel- 
lungsform, Publikation, Vorerfahrung Automatisierung, Medienkonsum Stimu- 
lithema, Themeninvolvement, Robot-Recall 

3. vermittelnde Variable: Nachrichtenthema, Erwartungs-Nichteinhaltung, 
Quellen-Antropomorphismus, Nachrichtenbias, Text- und Quellenglaubwürdig- 
keit, Maschinenheuristik 

4. Kontrollvariable: Nachrichtenthema, Stimulireihenfolge, Art der algorithmi- 
schen und hybriden Kennzeichnung, demografische Merkmale, kultureller Hin- 
tergrund, journalistisches Hintergrundwissen, Vorerfahrung Automatisierung, 
Nachrichtenkonsum, Themeninvolvement 


Insgesamt ist die Verwendung der Variablen ist jeweils unterschiedlich stark theo- 
retisch abgeleitet und ihre Anordnung und Operationalisierung überschneidet sich 
teilweise. Diese heterogene Operationalisierung ist dabei für den vorliegenden For- 
schungszweck der Exploration gewinnbringend: die Aufarbeitung der Rezeptions- 
studien generiert einen breiten Fundus an möglichen Einflussfaktoren, die sich zwar 
mehrheitlich auf die Glaubwürdigkeit beziehen, aber durchaus auch für Vertrauens- 
bewertungen relevant sind. Vollständig aufgelistet werden die verwendeten Ein- 
flussfaktoren der 15 Rezeptionsstudien, zusammen mit den Studienergebnissen des 
Folgeabschnitts, in Tabelle 9.3. Beschrieben ist in den Studien außerdem die Not- 
wendigkeit, in Anschlussarbeiten einzelne Themen und Faktoren genauer zu erläu- 
tern. Dies wird mit der vorliegenden Arbeit adressiert. Um dazu auswählen zu kön- 
nen, welche Variablen und Studienergebnisse für die vorliegende Arbeit besonders 
erkenntnisreich scheinen, erfolgt im nächsten Abschnitt die Auseinandersetzung mit 
den erzielten Studienergebnissen bezogen auf die verwendeten Einflussfaktoren. 


5.2.4 Darstellung der Studienergebnisse 


Zur Darstellung der Studienergebnisse werden zunächst die Ergebnisse der Meta- 
studie von Graefe und Bohlken (2020) besprochen und diese anschließend um die 
Ergebnisse der vorliegenden Literaturanalyse ergänzt und erweitert. Die Metastudie 
leistet einen fundierten Überblick über die Studienergebnisse der Mehrheit der 15 
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Rezeptionsstudien. Um die einzelnen Variablen und ihren Einfluss auf die Wahr- 
nehmung automatisiert generierter Texte beziehungsweise auf die Vertrauensbe- 
wertung des automatisierten Journalismus analysieren zu können, sind zusätzliche 
Ergebnisse der Primärstudien notwendig. Diese Aufarbeitung leistet die vorliegende 
Literaturanalyse. 


Überblick der Studienergebnisse in der Metastudie 

Graefe und Bohlken (ebd.) führen eine Metaanalyse zur Wahrnehmung computer- 
generierter Nachrichten von Lesenden ohne journalistischen Hintergrund durch und 
verwenden dazu im Wesentlichen die Studienauswahl, die auch für die Literatur- 
analyse der vorliegenden Arbeit getroffen wird??. Die Metastudie will einen sys- 
tematischen Überblick über Studien der Rezeptionsforschung zum automatisierten 
Journalismus leisten und zudem die Primärdaten zu aggregierten Größen zusam- 
menfassen, um die Aussagekraft der Ergebnisse zu erhöhen. Dazu unterscheiden 
Graefe und Bohlken (ebd.) Daten, die — innerhalb der Online-Experimente — in 
deskriptiven Studiensettings erhoben wurden und Werte, die aus experimentellen 
Studienaufbauten stammen’. 

Grundsätzlich zeigen die Ergebnisse der Metastudie, dass die Leser:innen die 
Glaubwürdigkeit von automatisiert generierten und menschlich verfassten Tex- 
ten gleich bewerten. In Bezug auf die wahrgenommene Qualität schneiden die 
menschlich verfassten Texte leicht besser ab, wobei die Unterschiede zwischen den 
Textarten gering sind. Bei der Bewertung der Lesbarkeit sind deutlichere Effekte 
zu messen: Hier bevorzugen die Proband:innen klar die Texte der Journalist:innen. 
Weiterhin ändert sich bei den Dimensionen ‚Glaubwürdigkeit‘ und ‚Qualität‘, nicht 
aber bei der ‚Lesbarkeit‘, die Richtung der Effekte, wenn zwischen experimentel- 
len und deskriptiven Nachweisen unterschieden wird. Insgesamt favorisieren die 


30 Graefe und Bohlken (2020) identifizieren zwölf relevante kommunikationswissenschaftli- 
che Studien in elf Publikationen, die zwischen 2017 und 2020 in Englisch und peer-review 
erschienen sind. Bis auf die fehlende Einbindung von Liu und Wei (2019) sind die Sam- 
plebildung und die Durchführung der Metaanalyse schlüssig und leistet einen umfassenden 
Einstieg über die Wahrnehmung des automatisierten Journalismus durch Leser:innen. In der 
Dokumentation schwierig nachzuvollziehen ist lediglich, welche Studien, oder welche Teile 
davon, konkret den experimentellen oder den deskriptiven Nachweis erbringen. 


31 In deskriptiv angelegten Experimenten werden zum Beispiel korrekt gekennzeichnete Texte 
vorgelegt, von den Proband:innen bewertet und keine weiteren Variablen einzeln getestet 
(Graefe und Bohlken 2020: 51,55). Im Experimentaldesign hingegen werden unabhängige 
Variablen isoliert getestet. Beispielsweise wird die Kennzeichnung der Textquelle zwischen 
Experimental- und Kontrollgruppen variiert, wobei der Nachrichteninhalt nicht verändert 
wird oder es werden Textstimuli unterschiedlichen Ursprungs, aber ohne Kennzeichnung 
verwendet. 
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Teilnehmenden im Experimentaldesign die menschlich verfassten Texte, wogegen 
beim deskriptiven Aufbau die computergenerierten Nachrichten als glaubwürdiger 
und von höherer Qualität bewertet werden (vgl. ebd.: 55). 

Zusätzlich stellen Graefe und Bohlken (ebd.) fest, dass auch bei der Quellen- und 
Textglaubwürdigkeit, als Subdimensionen der Glaubwürdigkeit, die Ergebnisse in 
Abhängigkeit der Art der Datenerhebung variieren. So zeigen zwar die addierten 
Werte, dass Lesende menschlich verfasste Texte bevorzugen, wenn nach der Quel- 
lenglaubwürdigkeit gefragt wurde. Sobald die Daten allerdings einzeln betrachtet 
werden, zeigt sich ein differenzierteres Bild: In experimentellen Studien werden 
menschlich geschriebene Nachrichten beziehungsweise deren Ursprung als glaub- 
würdiger bewertet, wogegen in deskriptiven Settings automatisiert generierte Nach- 
richten beziehungsweise Algorithmen als Autoren bevorzugt werden. Auch bei der 
Textglaubwürdigkeit zeigen sich Unterschiede abhängig von der Art der Erhebung: 
Im Experimentaldesign gibt keine Unterschiede in der Bewertung beider Textarten. 
In beschreibenden Verfahren hingegen werden automatisiert generierte Nachrichten 
gegenüber menschlich verfassten Texten deutlich bevorzugt. Werden die Werte der 
Studien zusammengefasst, zeigen die Daten, dass menschlich verfasste Nachrich- 
ten in Bezug auf die Textglaubwürdigkeit leicht bevorzugt werden. Bezogen auf 
die Quellen- und Textglaubwürdigkeit werden in deskriptiven Experimenten beide 
Male die automatisiert generierten Texte bevorzugt und der Effekt ist jeweils höher 
als bei experimentellen Versuchsaufbauten: Hier werden bei der Quellenglaubwür- 
digkeit die maschinengeschriebenen Texte favorisiert. Bei der Textglaubwürdigkeit 
kann kein Unterschied festgestellt werden (vgl. Graefe und Bohlken 2020: 55f.). 

Auch bei der Detailauswertung der Dimension Qualität stellen Graefe und Bohl- 
ken (ebd.) Unterschiede in den Ergebnissen bezogen auf die Art der Datenerhebung 
fest. So bewerten Proband:innen in deskriptiven Studien die Qualität von maschinen- 
geschriebenen Nachrichten höher als die Qualität menschlich verfasster Texte. Im 
Experimentaldesign hingegen werden menschlich geschriebene Nachrichten bevor- 
zugt, sowohl bei Effekten, die auf die Textquelle zurückzuführen sind sowie bei 
Effekten, die die Nachricht an sich betreffen. Zudem sind beide Effekte unterschied- 
lich ausgeprägt: Die Effekte bezogen auf den Textinhalt übertreffen die Effekte, die 
auf die Textquelle zurückzuführen sind (vgl. ebd.: 56 f.). Bezogen auf die Lesbarkeit 
gibt es keine Unterschiede der Ergebnisse in Bezug auf die Datenerhebung. Hier 
zeigen sowohl die experimentellen als auch die deskriptiven Nachweise eine Präfe- 
renz für menschlich verfasste Texte. Bei den Experimentaldesigns zeigt sich zudem, 
dass die Effekte bezogen auf die Nachrichteninhalte größere Auswirkungen haben 
als die Effekte der Textquelle. Im Vergleich zu den Dimensionen Glaubwürdigkeit 
und Qualität sind die Werte der Lesbarkeit der Texte insgesamt am deutlichsten 
ausgeprägt (vgl. ebd.: 56f.). 


126 5 Glaubwürdigkeit und Vertrauen in automatisiert generierte ... 


Detailanalyse in der Literaturanalyse 

Die Metaanalyse berücksichtigt die wahrgenommene Glaubwürdigkeit, Lesbarkeit 
und Qualität der computergenerierten Stimuli. Die, im Folgenden dargestellte Lite- 
raturanalyse, konzentriert sich auf die bewertete Text- und Quellenglaubwürdigkeit 
beziehungsweise auf erste Erkenntnisse zur Vertrauensbewertung. Detailliert wer- 
den dazu die Einflüsse der Textquelle, der Quellenkennzeichnung sowie die Nach- 
richtenthemen als wesentliche unabhängige Variablen beschrieben. Zudem folgen 
die Analysen zu den weiteren unabhängigen Variablen, die nur in einzelnen Arbei- 
ten thematisiert werden, aber zusätzlich relevante Erkenntnisse zur Wahrnehmung 
und zu den Einflussfaktoren dieser Bewertung liefern. Teilweise sind die Effekte 
der unabhängigen Variable nicht losgelöst vom Studiensetting oder der kombinier- 
ten Auswertung mit weiteren unabhängigen oder vermittelnden und moderieren- 
den Variablen zu betrachten (vgl. 5.2.3). Deshalb werden gegebenenfalls relevante 
Zusatzerkenntnisse aufgelistet, wenngleich der Schwerpunkt der Ausführung auf 
den Einflüssen der unabhängigen Variablen liegt. Wie bereits die Ergebnisse der 
Metaanalyse zeigen — und im Folgenden auch die Literaturanalyse verdeutlichen 
wird — sind in den 15 Rezeptionsstudien nur graduelle Unterschiede zwischen den 
Einflussfaktoren auf die wahrgenommene Text- und Quellenglaubwürdigkeit wahr- 
zunehmen. Dennoch ist die detaillierte Aufarbeitung der Studienergebnisse bezogen 
auf die einzelnen Faktoren wichtig, um für die vorliegende Arbeit unter den verwen- 
deten Variablen die Faktoren auszuwählen, die für Vertrauensurteile im automati- 
sierten Journalismus vermutlich relevant sind. Diese Aufarbeitung ist in Tabelle 5.1 
mit den Einflussfaktoren zur Wahrnehmung computergenerierter Nachrichtentexte 
zusammenfassend dargestellt und soll im Folgenden entlang der einzelnen Variablen 
besprochen werden. 


Einfluss der Textquelle 
Zum Einfluss der Textquelle auf die Wahrnehmung computergenerierter Nach- 
richten konnte die Metaanalyse von Graefe und Bohlken (ebd.) im Überblick 
zeigen, dass teilweise die menschlich verfassten Texte glaubwürdiger bewertet 
werden im Vergleich zu maschinengeschriebenen Texten. Dabei sind die Unter- 
schiede zwischen beiden Textarten gering und die Stärke und Richtung der Effekte 
unterscheiden sich je Studiensetting (vgl. ebd.: 55f.) (ausführlich beschrieben in 
Abschnitt 5.2.4). 

Insgesamt berücksichtigen neun der 15 Rezeptionsstudien die Textquelle als 
unabhängige Variable”. Davon können Haim und Graefe (2018a) keine 


32 Im Folgenden werden nur Ergebnisse berücksichtigt, deren Stimuli auch tatsächlich com- 
putergeneriert oder hybrid erzeugt wurden (vgl. Clerwall 2014; Jung et al. 2017; Haim und 
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Tabelle 5.1 Darstellung der Einflussfaktoren zur Wahrnehmung computergenerierter Nach- 
richtentexte aus dem Forschungsstand 


Haim und Graefe (2018), Jia (2020), 
Wu (2020), Melin et al. (2018), 
Grack et al. (2018), Haim und 
Graefe (2017), Jung et al. (2017), 

Clerwall (2014). Wölker und Powell 


Haim und Gracfe (2018), Van der 
Kaa und Krahmer (2014), Tandoc 
Jr. et al. (2020), Waddell (2019). Lin 
und Wei (2019), Zheng et al. 
(2018). Waddell (2018). Graefe et al. 
(2018), jung et al. (2017), Wu 
(2020) 
Unterschiedliche Ergebnisse 
Waddeil (2019). Waddell (2018). 
Gracfe et al. (2018), Haim und 
Graefe (2017), Wöler und Powell 
(2018), Wu (2020), Van der Kaa 
und Krahmer (2014), Jia (2020) 


Zheng et al (2018), Haim und 
Grac (2018), Van der Kaa und 
Kramer (2014) 


Kein Einfluss Kein Einfluss 
Wadideil (2018) Waddell (2019) 


Kein Einfluss Einfluss 
Tandoc jr. et al (2020) Liu und Wei (2019) 


Kein Einfluss 
Zheng et al. 2018) 


Zheng et al. (2018) 


Unterschiedliche Ergebnisse 
Waddell (2019), Liu und Wei 
2019) 


Kein Einfluss 


Kein Einfluss 
Kein Einfluss 
Clerzall (2014), Van der Kaa und 
Krahmer (2014), jung et al. (2017), 
Haim und Grack (2017), Graefe et 
al. (2018), Wölker und Powell 
(2018), Waddell (2028), Zheng et al. 
(2018). Liu und Wei (2019), Melin 
et al. (2018), Haim und Graefe 
(2018), Wu (2020), Waddell (2019), 
‚Ka (2020), Tandoc Jr. et al. (2020) 


Einfluss 
et al. (2017) 


Kein Einfluss 
efe et al. (2018) 
Kein Einfluss 


Qeichter) Einfluss 
Wäölker und Powell (2018) 


(2018) 
B | | 
Wäölker und Powell (2018) 


BEE. 


Graefe et al. (2018), Tandoc Jr. et al. 
(2020), Melin et al. (2018) 
Kein Einfluss is 
Haim und Graefe (2018) 


Tandoc jr. et al. (2020), Melin et al. 


Graefe et al. (2018), Liu und Wei 


Einfluss 
Waddeil (2018) 
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Auswirkungen und Clerwall (2014) nur in einem Indikator signifikante Auswir- 
kungen°°, auf die Wahrnehmung computergenerierter Nachrichten in Abhängigkeit 
der Textquelle feststellen (vgl. Haim und Graefe 2018a: 200). Die weiteren sie- 
ben Arbeiten messen hingegen Einflüsse in unterschiedlicher Ausprägung, die im 
Folgenden aufgeführt sind. 

Haim und Graefe (2017) fragen sowohl die Erwartungen als auch die tatsächliche 
Wahrnehmung von computergenerierten und menschlich verfassten Nachrichten ab. 
Dazu führen die Autoren zwei Teilexperimente mit verschiedenen Stimuli durch: In 
Experiment Eins lesen die Proband:innen einen Text und in Experiment Zwei lie- 
gen hingegen zwei Stimuli unterschiedlicher Quelle vor, sodass die Teilnehmenden 
einen bewussten Vergleich zwischen beiden Textarten ziehen können°*. In Experi- 
ment Eins gibt keine signifikanten Unterschiede bezogen auf die Textquelle, wobei 
die menschlich verfassten Texte in allen Kategorien leicht besser abschneiden. Im 
zweiten Experiment bevorzugen die Teilnehmenden die menschlich verfassten Texte 
bei der Lesbarkeit, stellen keine Unterschiede in Bezug auf die Qualität fest und 
bevorzugen maschinengeschriebene Texte bei der Glaubwürdigkeit (vgl. Haim und 
Graefe 2017: 1051-1054). Damit zeigen sich Unterschiede in der Wahrnehmung 
je nach Studiendesign. Die Ergebnisse zum Textvergleich und zu den Erwartungen 
werden in Abschnitt 5.2.4 besprochen. 

Jung et al. (2017) führen ihr Experiment” in Südkorea durch und vermuten, 
dass Lesende eher den Output von Algorithmen bevorzugen und die Arbeit von 
Journalist:innen weniger gut und weniger glaubwürdig bewerten werden. Diese 
Vermutung kann in der Datenauswertung bestätigt werden (vgl. ebd.: 295). 

Graefe, Haim et al. (2018) testen als Einflussfaktoren die Quelle, die Kennzeich- 
nung und Themen der Stimuli und variieren die Faktoren in einem 2x2x2-Setting®®. 


t35 


Graefe 2017; Haim und Graefe 2018a; Graefe, Haim et al. 2018; Wölker und Powell 2018; 
Melin et al. 2018; Wus 2020; Jia 2020). Arbeiten, deren Stimuli lediglich durch eine falsche 
Kennzeichnung generiert wurden, werden im Folgeabschnitt zur Kennzeichnung beschrieben. 


33 Die Unterschiede zwischen den Stimuli sich zu gering für statistische Zusammenhänge. 
Lediglich bei der Lesbarkeit als einem Indikator der Wahrnehmung wird eindeutig der mensch- 
lich verfasste Text bevorzugt (vgl. Clerwall 2014: 525 f.). 

34 Glaubwürdigkeit, Lesbarkeit und Qualität werden als abhängige und die Textquelle als 
unabhängige Variable verwendet. Zudem sind all Nachrichten korrekt gekennzeichnet, mög- 
liche Auswirkungen der Kennzeichnung werden nicht erfasst (vgl. Haim und Graefe 2017: 
1049-1051). 

35 Verwendet werden sowohl menschlich verfasste als auch tatsächlich maschinengeschrie- 
bene Texte. Jung et al. (2017) geben einmal die tatsächliche Kennzeichnung und einmal eine 
manipulierte Autor:innenzeile an. Zu den Effekten der Kennzeichnung (vgl. ebd.: 294 f.) und 
Folgeabschnitt zum Einfluss der Kennzeichnung. 

36 Zusätzlich untersuchen Graefe, Haim et al. (2018) wieder die Erwartungen an computerge- 
nerierte Texte und den Einfluss eines Vergleichs beider Textarten (vgl. dazu Abschnitt 5.2.4). 
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Die Themen der Stimuli haben keinen Einfluss auf die Bewertung von automatisiert 
generierten Texten, die Kennzeichnung leichte Auswirkungen und am wirkmäch- 
tigsten ist die Variation der Textquelle (vgl. dazu die folgenden Abschnitte). Die 
Ergebnisse von Graefe, Haim et al. (ebd.) zeigen, dass automatisiert generierte Texte 
in der Glaubwürdigkeit und Fachkenntnis höher bewertet werden als menschlich 
geschriebene Texte, wobei diese bei der bewerteten Lesbarkeit bevorzugt werden. 
Der Einfluss der Quelle zeigt sich dabei unabhängig von der Kennzeichnung, die 
die Autoren variieren (vgl. ebd.: 201 f.). 

Im Gegensatz zu den bisherigen Ergebnissen stellen Wölker und Powell (2018) 
fest, dass die Textglaubwürdigkeit- hier wurde auch die Vertrauenswürdigkeit abge- 
fragt — bei algorithmisiert generierten Texten höher ist als bei menschlichen verfass- 
ten Texten (mit Ausnahme des Sportberichts, dies wird im Abschnitt Thema berück- 
sichtigt). Zudem nehmen die Teilnehmenden die Glaubwürdigkeit der Quelle, also 
des Algorithmus und des Journalisten beziehungsweise der Journalistin, bei beiden 
Textarten als gleichwertig wahr (vgl. ebd.: 8-11). Die Autor:innen beschäftigen 
sich außerdem als erste Veröffentlichung?’ mit der möglichen Wirkung von hybri- 
den Texten auf die Bewertung der Nachrichten. Sie können Auswirkungen auf die 
Text- und Quellenglaubwürdigkeit in dem Sinne aufzeigen, als dass die Lesenden 
keine signifikanten Unterschiede zu den bisher untersuchten Textquellen ziehen. 
Die Werte liegen zwischen den Daten der computergenerierten und menschlich ver- 
fassten Stimuli, wenngleich die Unterschiede nicht signifikant sind (vgl. Wölker 
und Powell 2018: 9). Zudem können die Autor:innen aufzeigen, dass die bewer- 
tete Text- und Quellenglaubwürdigkeit von automatisiert generierten, hybriden und 
menschlich verfassten Stimuli die Nachrichtenauswahl von automatisiert generier- 
ten Texten nicht beeinflusst (vgl. ebd.: 9-11)°®. 


In sechs von acht Experimentalgruppen ist ein Vergleich beider Textarten möglich, in zwei 
Experimentalgruppen durch einen bewussten und in vier Gruppen durch einen unbewussten 
Vergleich. Als abhängige Variable fungieren die Glaubwürdigkeit, — Vertrauenswürdigkeit 
wird als ein Deskriptor operationalisiert — Lesbarkeit und die wahrgenommene Qualität der 
Stimuli (vgl. ebd.: 7£.). 


37 Und bisher auch am überzeugendsten, da die verwendeten Texte tatsächlich hybriden 
Ursprungs und nicht nur falsch-gekennzeichnet sind (vgl. Wölker und Powell 2018: 7-8,13). 
Insgesamt werden nur korrekt gekennzeichnete Texte verwendet, deshalb werden die Ergeb- 
nisse zum Einfluss von Quelle und Kennzeichnung im Grunde zusammen betrachtet. 

38 Wölker und Powell (ebd.) erheben dies in ihrer dritten Hypothese. Hier ist die Textquelle die 
unabhängige, die Selektivität die abhängige Variable und Text- und Quellenglaubwürdigkeit 
fungieren als vermittelnde Variable. Zusätzlich untersuchen die Autor:innen, ob die Vor- 
kenntnisse zum automatisierten Journalismus und der Medienkonsum zu Stimulithemen als 
moderierende Variablen die beschriebenen Wege beeinflussen (vgl. ebd.: 5). Deshalb werden 
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Die Ergebnisse von Melin et al. (2018) beziehen sich auf die wahrgenommene 
Glaubwürdigkeit, Lesevergnügen, Repräsentativität und die allgemeine Qualität 
von automatisiert generierten Wahlnachrichten im Vergleich mit entsprechenden 
menschlich verfassten Texten. Vertrauen oder Vertrauenswürdigkeit wird nicht erho- 
ben. In Abhängigkeit der Textquelle können die Forscher:innen Unterschiede aus- 
machen, so erreicht die automatisierte Berichterstattung in allen vier Kategorien 
niedrigere, aber für die Forscher:innen durchaus zufriedenstellende Zustimmungs- 
werte (vgl. ebd.: 43363 f.). Die Bewertungen von automatisiert generierten Texten 
sinken in absteigender Reihenfolge: Noch am höchsten, und nahezu vergleichbar 
mit menschlich verfassten Texten wird die Glaubwürdigkeit wahrgenommen, es 
folgt die Repräsentativität, dann die allgemeine Qualität und am wenigsten hoch 
eingeschätzt wird das Lesevergnügen. Die Autor:innen testen außerdem eine Reihe 
von Faktoren, auf deren Einflüsse im Folgenden noch eingegangen wird. An dieser 
Stelle wichtig zu erwähnen ist aber, dass die Zustimmungswerte für automatisiert 
generierte Texte durchaus differenzierter erfolgen, wenn zusätzliche Faktoren wie 
Demographie, Vorerfahrungen mit Automatisierung oder eine freie Wahl der Sti- 
mulitexte berücksichtigt werden (vgl. ebd.: 43364). 

Auch Wus (2020) kann Auswirkungen auf die Bewertung der Text- und Medi- 
umglaubwürdigkeit, der Objektivität und Bias zwischen beiden Textquellen feststel- 
len’. Die Autorin stellt für die alle vier unabhängigen Variablen signifikante Unter- 
schiede zwischen automatisiert generierten und menschlich verfassten Texten fest, 
unabhängig vom Thema oder dem Setting der Experimentalgruppe. Dabei wird den 
automatisiert generierten Texten eine höhere Objektivität, eine höhere Textglaub- 
würdigkeit sowie eine höhere Glaubwürdigkeit der Publikation zugeschrieben (vgl. 
ebd.: 1018f.). Zusätzlich werden die automatisiert generierte Texte als „less biased 
than human-written news stories“ (ebd.: 1019) bewertet. 

Weiterhin kann auch Jia (2020) Veränderungen in der Wahrnehmung und 
den Erwartungen in Abhängigkeit der Textquelle feststellen, wobei die Richtung 
und Stärke der Unterschiede mit den Themen und dem Design der Experimente 


die Studienergebnisse zur dritten Hypothese auch bei den vermittelnden und moderierenden 
Variable beschrieben, weil sie nicht losgelöst voneinander betrachtet werden können. 

3 Bei Wus (2020) wird jeweils das Nachrichtenthema, Textquelle sowie das Setting ver- 
ändert: In einer Gruppe findet ein korrekt gekennzeichneter, also bewusster Textvergleich 
statt und in der zweiten Gruppe ziehen die Proband:innen einen unbewussten, also nicht- 
gekennzeichneten, Vergleich. Die Glaubwürdigkeit wird erhoben als Text- und Mediums- 
glaubwürdigkeit, wobei bei letzten auch Vertrauenswürdigkeit als ein Deskriptor abgefragt 
wird (vgl. ebd.: 1015-1018). Zudem sind Unterschiede in der Stärke der Ergebnisse durch 
unterschiedliche Kennzeichnung festzustellen, diese werden im Abschnitt Effekte der Kenn- 
zeichnung aufgelistet. 
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variieren“. In Experiment Eins zeigen sich keine Unterschiede in der bewerteten 
Glaubwürdigkeit zwischen menschlich verfassten und computergenerierten Nach- 
richten. In der zweiten Teilstudie, in der ein unbewusster Textvergleich möglich ist, 
wurde die Glaubwürdigkeit je Textquelle unterschiedlich bewertet: Grundsätzlich 
gibt es einen nachgewiesenen Zusammenhang zwischen der abhängigen und unab- 
hängigen Variable, die Ergebnisse unterscheiden sich aber je Thema. Nur bei den 
Lokalnachrichten werden die menschlich verfassten Texte signifikant höher bewer- 
tet. Diese Richtung zeigt sich zwar auch bei den Finanznachrichten, hier kann aber 
nicht von statistischer Relevanz gesprochen werden. Maschinengeschriebene Nach- 
richten werden hingegen im Bereich Sport und bei Konferenzberichten bevorzugt, 
aber auch hier ist keine Signifikanz nachzuweisen (vgl. ebd.: 2618 f., 2621f.)*". 
Zusammengefasst wird deutlich, dass sieben von neun Studien, die die Text- 
quelle als unabhängige Variable verwenden, einen Einfluss der Textquelle auf die 
Wahrnehmung automatisiert generierter Texte feststellen (vgl. Jung et al. 2017; 
Haim und Graefe 2017; Graefe, Haim et al. 2018; Wölker und Powell 2018; Melin 
et al. 2018; Wus 2020; Jia 2020). Im Vergleich mit den weiteren unabhängigen 
Variablen, wie der Quellenkennzeichnung oder der Nachrichtenthemen, scheint 
die Textquelle den höchsten Zusammenhang mit der wahrgenommenen Glaubwür- 
digkeit zu erklären (vgl. z. B. Graefe, Haim et al. 2018; Wus 2020). Auch die 


40 Jia (2020) veröffentlicht zwei Teilexperimente und nutzt automatisiert generierte und 
menschlich verfasste Texte ohne Kennzeichnung. In beiden Teilstudien werden die Erwartung 
und die Wahrnehmung der Proband:innen bezogen auf die Glaubwürdigkeit, Lesbarkeit und 
Fachkenntnis der Stimuli erhoben. Vertrauenswürdigkeit wird als ein beschreibendes Item 
der Glaubwürdigkeit abgefragt. Als unabhängige Variablen fungieren die Textquelle sowie 
die Themen der Stimuli (vgl. ebd.: 2615-2618,2620f.). 


41 Zusätzlich zeigen beide Experimente unterschiedliche Ergebnisse bezogen auf die Les- 
barkeit und Fachkenntnis. In Experiment Eins kann auch hinsichtlich der Lesbarkeit kein 
Unterschiede zwischen den Textquellen festgestellt werden. Bei der Fachkenntnis hingegen 
werden signifikante Unterschiede nachgewiesen, dabei hängt die Richtung von den ausge- 
wählten Themen ab: Bei Lokal- und Finanznachrichten werden die menschlich verfassten 
Texte den maschinengeschriebenen vorgezogen, bei Konferenzberichten hingegen die com- 
putergenerierten höher bewertet und bei den Sportnachrichten gibt es keine Unterschiede 
zwischen beiden Textarten. In Experiment Zwei werden signifikante Unterschieden zwischen 
beiden Textquellen bezogen auf die wahrgenommene Lesbarkeit festgestellt: Die menschlich 
verfassten Texte übertreffen die computergenerierten Stimuli bei allen vier Themen. In Bezug 
zur Fachkenntnis kann ein allgemeiner Einfluss der Quelle nachgewiesen werden, der aber 
nicht in jedem einzelnen Thema festgestellt wird: Bei Sport-, Lokal- und Finanznachrichten 
unterliegen die maschinengeschriebenen Texte signifikant, bei Konferenznachrichten hinge- 
gen wird die computergenerierte Berichterstattung leicht bevorzugt, die Unterschiede sind 
aber zu gering für den Nachweis statistisch relevanter Zusammenhänge (vgl. ebd.: 2618f., 
2621 f.). 
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Ergebnisse der Metaanalyse können nachvollzogen werden, so werden in eini- 
gen Settings menschlich verfasste Texte bezogen auf die Glaubwürdigkeit höher 
bewertet und in einigen Experimenten hingegen automatisiert generierte Nachrich- 
ten als glaubwürdiger wahrgenommen. Insgesamt werden automatisiert generierte 
Nachrichten in der Mehrheit der sieben Studien als zufriedenstellend glaubwür- 
dig bewertet und auch hybride Nachrichten werden grundsätzlich als glaubwürdig 
wahrgenommen (vgl. Wölker und Powell 2018: 9). Deutlich zeigt die Aufarbeitung 
der Studien, dass die Einflüsse der Textquelle nicht losgelöst von weiteren Faktoren 
und unabhängig vom Studiensetting ermittelt werden können. Es gibt beispielsweise 
Differenzierungen in den Ergebnissen zum Einfluss der Textquelle bezogen auf eine 
Kombination von Wahrnehmungen und Erwartungen, bewussten und unbewussten 
Vergleichen oder Kombinationen mit demografischen Merkmalen, kulturellen Hin- 
tergründen oder verwendeten Stimuli. Die Variation von Detailergebnissen und Dif- 
ferenzierungen spiegelt die Aufarbeitung der Medienbewertungs- und Vertrauens- 
forschung in Kapitel 4 wider: Medienbewertungen und Vertrauensentscheidungen 
sind keine monokausalen Entscheidungen, sondern komplexe soziale Konstrukte 
und demzufolge ist die Wahrnehmung automatisiert generierter Nachrichten nicht 
allein auf eine Variation der Textquelle zurückzuführen. 


Einfluss der Quellenkennzeichnung 

Zehn von 15 Rezeptionsstudien operationalisieren die Kennzeichnung der Texte als 
unabhängige Variable’. Dabei stellen Haim und Graefe (2018a), Van der Kaa und 
Krahmer (2014) keinen Einfluss der Kennzeichnung fest. Acht weitere Arbeiten 
dokumentieren Wirkungen, die sich auf die Kennzeichnung beziehungsweise auf 
eine Faktorenkombination mit der Kennzeichnung zurückführen lassen. 


42 Die Begriffe Kennzeichnung, Kennzeichnung der Texte und Quellenkennzeichnung werden 
synonym verwendet. Haim und Graefe (2017), Wölker und Powell (2018) unterscheiden nicht 
zwischen der Wirkung der Quelle und des Einflusses der Kennzeichnung, deshalb sei hier auf 
die bereits besprochenen Ergebnisse hingewiesen. Außerdem verwenden Jia (2020), Clerwall 
(2014) und Melin et al. (2018) ausschließlich nicht-gekennzeichnete Texte, das heißt auch 
hier sind die Ergebnisse bereits im Abschnitt zum Einfluss der Textquelle besprochen. So 
bleiben zehn von 15 Rezeptionsstudien, die Wirkungen der Kennzeichnung untersuchen (vgl. 
Van der Kaa und Krahmer 2014; Jung et al. 2017; Haim und Graefe 2018a; Zheng et al. 2018; 
Graefe, Haim et al. 2018; Waddell 2018, 2019; Liu und Wei 2019; Wus 2020; Tandoc Jr. et al. 
2020). 
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In der Auswertung bei Tandoc Jr. et al. (2020)*° können keine signifikanten 
Effekte festgestellt werden, die sich nur auf die Kennzeichnung zurückführen las- 
sen. Zusätzlich ermitteln die Autor:innen, ob es Interaktionseffekte mit der Kenn- 
zeichnung und der zusätzlich eingeführten unabhängigen Variable ‚Objektivität der 
Texte‘ gibt und ob beide zusammen einen Einfluss auf die abhängigen Variablen 
haben: Hier kann sowohl für die Text- als auch für die Quellenglaubwürdigkeit eine 
Wechselwirkung ermittelt werden. Bei den menschlich verfassten Texten werden die 
objektiv wahrgenommenen Nachrichten als weniger glaubwürdig, sowohl bezogen 
auf die Quelle als auch den Inhalt, eingeschätzt im Vergleich zu den nicht-objektiven 
Texten. Bei den automatisiert generierten Texten dagegen wird die Glaubwürdig- 
keit der Algorithmen und die Glaubwürdigkeit der Textinhalte bei objektiven Texten 
höher bewertet als bei den nicht-objektiven Vergleichsstimuli (vgl. auch Ergebnisse 
weiterer unabhängiger Variablen in Abschnitt 5.2.4). Die zudem abgefragte hybride 
Kennzeichnung verhält sich im Muster analog zur menschlichen Kennzeichnung 
(vgl. ebd.: 555-559). 

Auch die Ergebnisse der Quellenvariation bei Wus (2020) wurden thematisiert. 
Im Experiment lesen die Proband:innen immer zwei Stimuli; davon je eine auto- 
matisiert generierte und eine menschlich verfasste Nachricht. Zusätzlich gibt es 
zwei Experimentalgruppen, da die Stimuli einmal gekennzeichnet werden und ein 
bewusster Textvergleich möglich ist und einmal nicht-gekennzeichnete Nachrich- 
ten vorliegen, also ein unbewusster Vergleich der Textarten erfolgt. Die Ergebnisse 
zeigen, dass es signifikante Unterschiede zwischen beiden Gruppen und der bewerte- 
ten Objektivität, Text- und Quellenglaubwürdigkeit sowie der Nachrichtenbias gibt: 
Mit Ausnahme der Nachrichtenbias liefern Texte ohne Kennzeichnung signifikant 
höhere Werte als gekennzeichnete Stimuli. Damit gibt es Effekte der Kennzeich- 
nung, die im Fall dieser Studie möglicherweise weniger auf die Kennzeichnung 
sondern auf den Unterschied zwischen bewusstem und unbewusstem Textvergleich 
zurückzuführen sind (vgl. ebd.: 1018f.) (vgl. Abschnitt 5.2.4). 

Bei Liu und Wei (2019)** hat die Variation der Kennzeichnung signifikante 
Unterschiede zwischen menschlich geschrieben und computergenerierten Stimuli 


43 Die Autor:innen testen den Einfluss der Kennzeichnung (und der Objektivität) auf die 
bewertete Text- und Quellenglaubwürdigkeit. Die Textquelle wird nicht verändert, sondern 
lediglich die Kennzeichnung manipuliert. Zwei Hypothesen beziehen sich auf den Einfluss 
der Kennzeichnung auf die Quellen- sowie die Textglaubwürdigkeit. Jeweils ein Indikator 
erhebt hierbei auch das Vertrauen in den Text beziehungsweise in die Quelle (vgl. Tandoc Jr. 
et al. 2020: 551-554). 

^4 Liu und Wei (2019) manipulieren zwar die Kennzeichnung der Stimuli, nicht aber 
die Quelle. Als unabhängige Variable fungiert die Kennzeichnung. Zusätzlich werden die 
Publikation und die journalistische Darstellungsform als mögliche moderierende Variablen 
berücksichtigt. Die abhängigen Variablen Glaubwürdigkeit und Fachkenntnis werden um 
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bei den abhängigen Variablen ‚Emotionales Involvement‘ , ‚Objektivität‘ und ‚Fach- 
kenntnis der Quelle‘ , nicht aber bei der Glaubwürdigkeit und der Vertrauenswürdig- 
keit der Quelle zur Folge. Automatisiert generierte Text lösen weniger Emotionales 
Involvement aus als ihre Vergleichsstimuli und werden als objektiver bewertet. Dafür 
wird den (menschlichen) Journalist:innen mehr Fachkenntnis zugeschrieben als den 
Algorithmen. Die kombinierte Auswertung der Kennzeichnung und der Publikation 
als moderierende Variable berücksichtigt, dass signifikante Unterschiede zwischen 
den Experimentalgruppen bei der Objektivität, Vertrauenswürdigkeit der Quelle 
und der zugeschriebenen Fachkenntnis der Quelle festzustellen sind, nicht aber bei 
der Textglaubwürdigkeit: Bezogen auf das Vertrauen in die Quellen und die wahr- 
genommene Fachkenntnis der Verfasser:innen sind keine Unterschiede zwischen 
den Textarten festzustellen, wenn die Publikation als vertrauenswürdig gilt*°. Die 
kombinierte Auswertung der Kennzeichnung und der Darstellungsform als mode- 
rierende Variable zeigt signifikante Effekte nur bei der bewerteten Textglaubwürdig- 
keit. Kommentierende Texte werden in der Textglaubwürdigkeit insgesamt höher 
bewertet, wenn die Quelle als automatisiert generiert gekennzeichnet ist und infor- 
mierende Texte schneiden besser ab, wenn die Kennzeichnung Journalist:in lau- 
tet. Insgesamt zeigen menschlich gekennzeichnete Texte keine signifikanten Unter- 
schiede zwischen den Darstellungsformen. Der Inhalt von automatisiert generierten 
Texten hingegen wird bei informierenden Texten als weniger glaubwürdig bewertet 
als automatisiert generierte kommentierende Texte (vgl. Liu und Wei 2019: 646- 
651). 

Waddell (2018) führt zwei Teilexperimente zur Textglaubwürdigkeit compu- 
tergenerierter Nachrichten mit unterschiedlicher Komplexität durch*°. Im ersten 


Embotionales Involvement, Objektivität der Texte sowie das Vertrauen in die Quelle erweitert. 
Vertrauen in den oder die Verfasserin ist als eigenständige Variable angelegt und wird mit 
fünf Items erhoben (vgl. ebd.: 645). 

45 Es findet keine kombinierte Auswertung zur Variable Emotionales Involvement statt. Auto- 
matisiert generierte Texte, die in vertrauenswürdigen Publikationen (hier: New York Times) 
erschienen sind, werden als objektiver wahrgenommen als die menschlich verfassten Ver- 
gleichstexte. Kein Unterschied in der bewerteten Objektivität beider Textarten ist festzu- 
stellen, wenn die Kennzeichnung mit einer weniger vertrauenswürdigen Publikation (hier: 
Fox News) kombiniert wird. Außerdem werden Algorithmen bei weniger vertrauenswürdigen 
Publikation als weniger vertrauensvoll und mit einer geringeren Fachkenntnis bewertet als 
die menschlichen Verfasser:innen (vgl. Liu und Wei 2019: 645-649). 


46 Neben der Textglaubwürdigkeit verwendet der Autor als abhängige Variable den Nach- 
richtenwert, die wahrgenommene Qualität und Repräsentativität der Stimuli. Im zweiten 
Experiment werden die abhängigen Variablen zusätzlich um die Issue Importance (übersetzt 
mit wahrgenommenen Wichtigkeit des Nachrichtenthemas) erweitert. Zur externen Validität 
der Stimuli beider Experimente sei darauf hingewiesen, dass Waddell (2018) ausschließlich 
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Experiment wird allein der Einfluss der Quellenkennzeichnung erhoben: Die Pro- 
band:innen bewerteten automatisiert generierte gekennzeichnete Texte signifikant 
schlechter als die menschlich gekennzeichneten Stimuli (vgl. ebd.: 241-243). 
Das zweite Experiment und dessen Auswertung ist umfangreicher, indem der 
Autor vermittelnde und moderierende Variablen einführt. Als vermittelnde Faktoren 
werden die Maschinenheuristik, die Nichteinhaltung von Erwartungen, Quellen- 
Antropomorphismus und die Nachrichtenthemen berücksichtigt und als moderie- 
rende Variable der so genannten Robot-Recall (vgl. ebd.: 243-246). Die Kenn- 
zeichnung wird immer in Verbindung mit vermittelnden Faktoren ausgewertet. Ins- 
gesamt gibt es signifikante Unterschiede in der wahrgenommenen Glaubwürdig- 
keit, wenn zwischen menschlich und maschinengeneriert gekennzeichneten Texte 
unterschieden wird. Letztere werden als weniger glaubwürdig eingeschätzt. Außer- 
dem können Quellenantropomorphismus und die Nichteinhaltung von Erwartungen 
die Beziehung zwischen der unabhängigen und abhängigen Variable (mit) erklären 
(vgl. ebd.: 247£.)*’. Mit den Befunden wird die Liste an möglichen Einflussfaktoren 
um eine Reihe relevanter vermittelnder und moderierender Variablen erweitert. In 
der nachfolgenden Publikation kann Waddell (2019) zeigen, dass es bei automati- 
siert generierten Texten sowohl einen indirekt positiven Effekt auf die Textglaub- 
würdigkeit über die vermittelnde Rolle der Nachrichtenbias gibt als auch einen 


Nachrichten verwendet, die von Journalist:innen verfasst wurden. Für die maschinengeschrie- 
bene Stimuli wird lediglich die Autor:innenzeile manipuliert. Deshalb werden die Ergebnisse 
im Abschnitt Kennzeichnung, nicht aber bei den Einflüssen der Quelle beschrieben. Zur Vali- 
dität der Stimuli vgl. 5.2.2. 


47 Die Befunde ausführlicher: Zunächst wird keine negative Auswirkung der algorithmischen 
Kennzeichnung bezogen auf die abhängigen Variablen durch einen indirekten Effekt der 
Maschinenheuristik und der Erwartungs-Nichteinhaltung nachgewiesen. Auch eine, von den 
Autoren vermutete, Erhöhung der Glaubwürdigkeit und der Issue Importance durch einen 
Algorithmus in der Verfasserzeile in Kombination mit indirekten Effekten eines Quellen- 
Antropomorphismus sowie der Erwartungs-Nichteinhaltung konnte nicht bestätigt werden 
(ebenso wenig eine negativere Bewertung, die Ergebnisse sind schlicht neutral). Im Gegen- 
satz dazu wurde die Vermutung bestätigt, dass ein algorithmischer Autor als weniger anthro- 
pomorph bewertet wird als ein menschlicher Autor und damit zu geringeren Werten der 
abhängigen Variablen führt (vgl. ebd.: 246f.). Außerdem kann Waddell (ebd.) einen indirek- 
ten Effekt auf die Bewertung und bisher getesteten Beziehungen von automatisiert generiert 
gekennzeichneten Stimuli und den vermittelnden Variablen durch den so genannten Robot- 
Recall nachweisen. Das heißt, wenn sich Proband:innen an eine Mediendarstellung von Robo- 
tern erinnern können, hat dies Auswirkungen auf die bisher getesteten Kombinationen der 
abhängigen und vermittelnden Variablen. Der Autor hält fest, dass mit dem Robot-Recall 
insbesondere der Quellenantrophomorphismus zwischen menschlichen und algorithmischen 
Verfasser:innen verändert wird, was weitere Konsequenzen für die Wahrnehmung hat. Mög- 
liche Einflüsse durch die Themen der Stimuli auf alle Hypothesen wurden getestet und aus- 
geschlossen (vgl. ebd.: 247 f.). 
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indirekt negativen Effekt auf die Textglaubwürdigkeit über die vermittelnde Rolle 
des Quellen-Antropomorphismus”®. Zudem wird getestet, wie Texte mit hybrider 
Kennzeichnung im Vergleich zu menschlich gekennzeichneten Nachrichten bei der 
Textglaubwürdigkeit abschneiden, wenn die indirekten Effekte der Nachrichtenbias 
und des Quellen-Antropomorphismus berücksichtigt werden (vgl. ebd.: 9-12). Die 
Ergebnisse greifen die bisherigen Erkenntnisse auf: Im Vergleich unterschiedlicher 
Textquellen steigt die wahrgenommene Glaubwürdigkeit von hybrid gekennzeich- 
neten Texten durch den indirekten Einfluss von Nachrichtenbias und sinkt aufgrund 
der Einflüsse des Quellen-Antrophomormismus. Weiterhin testet Waddell (ebd.), 
ob und wenn ja, welchen Einfluss verschiedene Varianten oder Formulierungen der 
Kennzeichnung haben. Hier zum Beispiel die Frage, ob eine Organisationskennzei- 
chung wie ‘Automated Insights’ anders wahrgenommen wird als eine Autorenzeile, 
die den Namen des Algorithmus enthält, wie ‘Quill’. Der Autor kann keinen signi- 
fikanten Unterschied zwischen beiden Kennzeichnungen messen. Schlussendlich 
schließt Waddell (ebd.) mögliche Störfaktoren durch eine multiple Quellenkenn- 
zeichnung, wie beispielsweise bei einer hybriden Kennzeichnung, weitestgehend 
aus (vgl. ebd.: 13-15). 

Der Studienaufbau und die Ergebnisse von Graefe, Haim et al. (2018) zum 
Einfluss der Quelle wurden bereits beschrieben’. Insgesamt ist die veränderte 
Wahrnehmung auf die Variation der Textquelle zurückzuführen und eine Varia- 
tion der Themen zeigt keinen Einfluss. Nur geringe Unterschiede zwischen den 
Experimentalgruppen lassen sich auf eine Veränderung der Kennzeichnung zurück- 
führen: Diese Unterschiede zeigen bei allen drei unabhängigen Variablen in die 
gleiche Richtung, erreichen aber nur bei einer Ausnahme ein zufriedenstellendes 
Signifianzniveau. Die Stimulitexte werden mit einer Ausnahme durchweg höher 
in der Glaubwürdigkeit, Fachkenntnis und in der Lesbarkeit bewertet, wenn ein 


48 Auch hier verwendet der Autor als Stimuli keine maschinenverfasste oder hybrid erzeugte 
Nachrichten sondern manipuliert lediglich deren Kennzeichnung. Als unabhängige Variablen 
sind Kennzeichnung, Thema und Publikation angelegt und als abhängige Variable fungiert die 
Glaubwürdigkeit. Außerdem testet der Autor Quellen-Antropomorphismus und Nachrichten- 
bias als abhängige sowie zusätzlich beide Faktoren als vermittelnde Variablen. Zudem erhebt 
er den Einfluss der Formulierung der Kennzeichnung als mögliche Störvariable (vgl. Waddell 
2019: 5-8). Die moderierenden Effekte treten mit einem ausreichend hohem Signifikanz- 
niveau zwischen beiden gekennzeichneten Textarten auf; die hybride Kennzeichnung wird 
nicht berücksichtigt. Zusätzlich wird die Variation des Themas sowie der Einfluss der Publi- 
kation kontrolliert: Es können für beide Faktoren keine Unterschiede in der Wahrnehmung 
der Stimuli festgestellt werden. 

4 Zusammengefasst werden im Experiment die tatsächliche Quelle, die Kennzeichnung und 
die Themen der Nachrichtenartikel variiert. Als unabhängige Variablen sind die wahrgenom- 
mene Glaubwürdigkeit, Lesbarkeit und Fachkenntnis angelegt. 
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Journalist als Verfasser angegeben wurde, auch unabhängig von der tatsächlichen 
Quelle. Die Ausnahme sind maschinengenerierte Texte, deren Lesbarkeit signifi- 
kant höher bewertet wird, wenn sie fälschlicherweise als menschlich geschrieben 
gekennzeichnet werden (vgl. Graefe, Haim et al. 2018: 9£.). 

Bei Zheng et al. (2018) geht es um einen Vergleich der Wahrnehmung compu- 
tergenerierter Texte zwischen chinesischen und US-amerikanischen Proband:innen. 
Dabei fungieren die wahrgenommene Qualität, die Vorliebe für die jeweilige 
Textart und das Vertrauen in die Texte als abhängige Variablen. Zunächst testen 
die Autor:innen die unabhängigen Variablen und deren Einflüsse univariat: Die 
Variation der Kennzeichnung (oder der Publikation) hat keinen direkten Einfluss 
auf die Wahrnehmung der abhängigen Variablen. Signifikante Effekte können nur 
in Bezug auf den kulturellen Hintergrund festgestellt werden°!. Die Autor:innen 
testen in einem zweiten Auswertungsschritt, ob Interaktionseffekte zwischen den 
unabhängigen Variablen bestehen und ob diese Wechselbeziehungen Einfluss auf 
die abhängigen Variablen haben. Interaktionseffekte zwischen Kennzeichnung und 
Publikation finden sich nur bei den abhängigen Variablen ‚Qualität‘ und ‚Vor- 
liebe‘ und jeweils nur innerhalb der chinesischen Experimentalgruppen. Diese 
können nicht für Teilnehmende aus den USA und für beide Ländergruppen nicht 
für die abhängige Variable ‚Vertrauen‘ nachgewiesen werden’”. Abschließend 


50 Insgesamt werden die Kennzeichnung der Quelle, der kulturelle Hintergrund der Teilneh- 
menden sowie die Publikation als unabhängige Variable operationalisiert (vgl. Abschnitt 16). 
Das Thema dient als Kontrollvariable. Die Quelle wird nicht variiert, die Stimuli wurden 
rein menschlich verfasst und korrekt sowie manipuliert angegeben. Als abhängige Variablen 
fungieren die wahrgenommene Qualität sowie die Vorliebe für und das Vertrauen in die Sti- 
muli. Vertrauen ist nicht, wie häufig, als Unterdimension der Glaubwürdigkeit sondern als 
eigenständige Variable mit 16 Items operationalisiert (vgl. Zheng et al. 2018: 269 f.). 


5! Der kulturelle Hintergrund hat signifikanten Einfluss sowohl auf die wahrgenommene Qua- 
lität sowie einen (marginal) signifikanten Effekt auf die Vorliebe dieser Texte, nicht aber auf 
das bewertete Vertrauen in die Stimuli. So bewerten US-amerikanische Proband:innen die 
Qualität der Texte und die Vorliebe dafür höher als die chinesische Vergleichsgruppe. Bezo- 
gen auf Vertrauen sind keine Unterschiede feststellbar (vgl. ebd.: 270£.). 


52 Das heißt, dass US-Proband:innen menschlich verfassten Texte bezogen auf die Qualität 
jeweils unabhängig von der Art der Publikation höher einschätzen als automatisiert generierte 
Nachrichten. Chinesische Rezipient:innen hingegen bewerten die Qualität von menschlich 
verfassten Texte in der Online-Version negativer als menschlich verfasste Nachrichten in tra- 
ditionellen Publikationen. Automatisiert generiert gekennzeichnete Texte dagegen werden in 
Online-Publikationen mit höherer Qualität bewertet als in traditionellen Veröffentlichungen. 
Bei der Auswertung der Ergebnisse zur bewerteten Vorliebe zeigt sich ein ähnliches Muster. 
Auch hier gibt es keine Interaktionseffekte zwischen der Kennzeichnung und der Publikation 
in den US-amerikanischen Experimentalgruppen. Menschlich verfasste Texte werden sowohl 
in der Online-Publikation als auch in traditionellen Veröffentlichungen höher bewertet als 
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beschreiben die Autor:innen, dass grundsätzlich mehr Gemeinsamkeiten als Unter- 
schiede in den Bewertungen zwischen beiden Ländergruppen vorliegen. Der kultu- 
relle Hintergrund hat den jeweils größten Einfluss bei der Bewertung der Qualität 
und der Vorliebe für beide Textarten, wogegen sowohl die Kennzeichnung als auch 
die jeweilige Publikation nur geringe Unterschiede aufweist. Wenn Unterschiede 
festzustellen sind, dann zeigen sich diese maßgeblich bei der bewerteten Qualität, 
weniger Wirkung hat die Vorliebe der Texte und keine Veränderungen ist beim 
gemessenen Vertrauen in die Stimuli festzustellen (vgl. ebd.: 270-273). 

Wie besprochen führen Jung et al. (2017) ihr Experiment in Südkorea durch 
und können zunächst Einflüsse der Textquelle auf die bewertete Glaubwürdigkeit 
feststellen. Gleiches gilt für die Kennzeichnung der Texte: unabhängig von der 
tatsächlichen Textquelle bewerten Lesende menschlich gekennzeichnete Texte als 
signifikant weniger glaubwürdig im Vergleich zu computergeneriert gekennzeich- 
neten Nachrichten. Nachdem die Autor:innen sowohl die Textquelle als auch die 
Kennzeichnung manipulieren, können sie zeigen, dass Nachrichten immer dann als 
glaubwürdiger bewertet werden, wenn die Teilnehmenden davon ausgehen kön- 
nen, dass die Stimuli maschinengeneriert sind: die Teilnehmenden bewerteten die 
computergenerierte Nachrichten schlechter, wenn die Kennzeichnung manipuliert 
wurde und menschlich verfasst lautete. Ebenso wurden menschlich verfasste Texte 
besser bewertet, wenn die Kennzeichnung algorithmisiert generierte Nachrichten 
auswies. 

Insgesamt zeigt die Aufarbeitung der Studien zum Einfluss der Kennzeichnung, 
dass — neben dem Einfluss der Textquelle — auch keine monokausalen Zusammen- 
hänge zwischen der Kennzeichnung von automatisiert generierten Nachrichten und 
der wahrgenommenen Textglaubwürdigkeit bestehen. Im Vergleich beider unabhän- 
giger Variablen sind die Effekte der Kennzeichnung weniger deutlich ausgeprägt als 
die Effekte der Textquelle. Auch in Bezug auf die Kennzeichnung gibt eine Varia- 
tion an Studiensettings und eine Differenzierung der Konzeptionen mit einer Reihe 
vermittelnder und moderierender Faktoren. 


Einfluss des Themas 

Von den 15 Rezeptionsstudien erheben acht Arbeiten den Einfluss des Themas 
der Stimuli auf die Wahrnehmung automatisiert generierter Nachrichten (vgl. 
Tabelle 9.3 im Anhang ‚Forschungsstand Rezeptionsstudien‘ im elektronischen 


die automatisiert generierten Vergleichstexte. Unter den chinesischen Proband:innen zeigen 
sich wieder Wechselwirkungen, so bevorzugen die Teilnehmenden automatisiert generierte 
Texte in den Online-Publikationen und menschlich verfasste Texte in traditionellen Veröf- 
fentlichungen (vgl. ebd.: 270-273). 
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Zusatzmaterial)” Davon können vier Arbeiten keine Effekte feststellen (vgl. Haim 
und Graefe 2017; Graefe, Haim et al. 2018; Waddell 2018, 2019). Demzufolge blei- 
ben vier Studien, die die Wirkung des Themas untersuchten und zumindest leichte 
Effekte feststellen konnten (vgl. Van der Kaa und Krahmer 2014; Wölker und Powell 
2018; Wus 2020; Jia 2020). Die Ergebnisse von Wus (2020) werden nicht weiter 
thematisiert, da sie sich nur auf die abhängige Variable Nachrichtenbias und nicht 
auf die Glaubwürdigkeit beziehen’*. 

Auch Jia (2020) verwendet für ihre zwei Experimente mit Sport-, Finanz-, 
Konferenz- und Lokalnachrichten? und die Themen bestimmen vor allem Stärke 
und Richtung der jeweiligen Bewertung. In Experiment Eins kann die Autorin einen 
signifikanten Unterschied zwischen automatisiert generierten und menschlich ver- 
fassten Texten nur hinsichtlich der wahrgenommen Fachkenntnis, nicht aber bezüg- 
lich der Glaubwürdigkeit und der Lesbarkeit feststellen°®. Die Ergebnisse des zwei- 
ten Experiments zeigen dagegen unterschiedliche Bewertung der Stimuli in Abhän- 
gigkeit der Themen für die wahrgenommene Glaubwürdigkeit und Fachkenntnis, 
nicht aber für die Lesbarkeit. Proband:innen bewerten die Glaubwürdigkeit mensch- 
lich verfasster Nachrichten bei Lokal- und Finanzthemen höher und bevorzugen 


53 In fünf Arbeiten spielt der Faktor Thema keine Rolle, da er nicht erhoben oder nicht einzeln 
getestet wurde, indem beispielsweise nur ein Nachrichtenthema als Stimuli gewählt wurde 
(vgl. Tandoc Jr. et al. 2020; Liu und Wei 2019; Melin et al. 2018; Jung et al. 2017; Clerwall 
2014). In zwei weiteren Arbeiten wird Thema zusätzlich als vermittelnde (vgl. Waddell 2018) 
beziehungsweise als moderierende Variable (vgl. Waddell 2019) umgesetzt und zudem nutzen 
Zheng et al. (2018), Haim und Graefe (2018a) und Van der Kaa und Krahmer (2014) das Thema 
als Kontrollvariable. 


54 Wus (2020) kann Unterschiede zwischen automatisiert generierten und menschlich verfass- 
ten Texten ausmachen, da die Themen in beiden Gruppen als unterschiedlich ‘more biased’ 
wahrgenommen werden. Bei menschlich verfassten Texten sind dies: Politikberichte werden 
als parteiischer beziehungsweise voreingenommener wahrgenommen als Sportberichte und 
diese wiederum einseitiger als Finanzberichte. Dahingegen werden automatisiert generierte 
Finanzberichte ‘more biased’ eingeschätzt als entsprechende Sportberichte und Sportberichte 
wiederum einseitiger im Vergleich zu Politikberichten (vgl. ebd.: 1019). 


55 Die Experimente beziehen sich auf chinesische Proband:innen und nutzen automatisiert 
generierte und menschlich verfasste Texte ohne Kennzeichnung. In beiden Teilstudien werden 
sowohl die Erwartung als auch die Wahrnehmung bezogen auf die Glaubwürdigkeit, Lesbar- 
keit und Fachkenntnis erhoben (vgl. Jia 2020: 2620). Wie beschrieben sind die Haupteffekte in 
der Wahrnehmung des computergenerierten Nachrichten auf die Textquelle zurückzuführen 
(vgl. ausführlich Abschnitt 5.2.4). 

56 Dabei ist die Richtung der Unterschiede zwischen beiden Textarten bezogen auf die Fach- 
kenntnis von den Themen abhängig ist: Unterschiede sind bei Finanz-, Konferenz- und Lokal- 
nachrichten auszumachen, nicht bei Sportberichten (vgl. ebd.: 2619). Die Fachkenntnis von 
menschlich verfassten Texten ist signifikant höher bei Lokal- und Finanznachrichten und 
niedriger bei Konferenztexten im Vergleich zu computergenerierten Texten. 
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computergenerierte Texte bei Sport- und Konferenztexten (vgl. ebd.: 2622)°’. Wöl- 
ker und Powell (2018) nutzen einen Finanz- und einen Sportbericht und können 
nur für ein Thema eine Wirkung feststellen: Wenn ein automatisiert generierter 
Sportbericht vorliegt, dann wurde die Textglaubwürdigkeit höher bewertet als bei 
menschlich verfassten Sportnachrichten. Für Finanzberichte gilt dieser Zusammen- 
hang nicht (vgl. ebd.: 9). Auch bei Van der Kaa und Krahmer (2014) lesen die 
Teilnehmenden einen Sport- oder einen Finanzbericht: Das Thema wurde als kon- 
trollierende Variable in Bezug auf die Vertrauenswürdigkeit und die Fachkenntnis 
von automatisiert generierten Texten konzipiert. Im Wesentlichen hat das Thema 
keinen Einfluss auf die Wahrnehmung, lediglich bei der bewerteten Vertrauenswür- 
digkeit schneiden Finanzartikel leicht besser ab (vgl. ebd.: 3). 

Insgesamt kann zum Einflussfaktor Thema festgehalten werden, dass nur drei 
von zehn Arbeiten, die das Thema in Bezug zur Glaubwürdigkeit berücksichtigen, 
überhaupt einen Einfluss der Variable feststellen können. Wenn Effekte des Themas 
auftreten, so sind diese — im Vergleich zu den anderen unabhängigen Variablen 
der Quelle und der Kennzeichnung — eher von geringer Bedeutung und zeigen 
Auswirkungen gegebenenfalls im Detail. 


Ergebnisse der weiteren unabhängigen Variablen 

Als weitere unabhängige Variable führen Tandoc Jr. et al. (2020), wie im 
Abschnitt 5.2.3 zu Konzeption der Studien beschrieben, die Objektivität der 
Texte”? ein. Die Autor:innen können keinen Einfluss auf die Text- und Quellenglaub- 
würdigkeit feststellen. Sie weisen aber Interaktionseffekte zwischen der Kennzeich- 
nung und der Objektivität als unabhängige Variablen nach, die bereits bei den Ergeb- 
nissen zum Einfluss der Kennzeichnung beschrieben sind (vgl. Abschnitt 5.2.4). 
Zusätzlich zur Kennzeichnung nehmen auch Zheng et al. (2018) den kulturellen 
Hintergrund der Teilnehmenden sowie die Publikation als unabhängige Variable 
mit auf. Zunächst testen die Autor:innen den Einfluss jeder unabhängigen Variable 
im Einzelnen und können signifikante Wirkungen beim kulturellen Hintergrund, 


57 Bezogen auf die Lesbarkeit favorisieren die Teilnehmenden in Experiment Zwei über alle 
Themen hinweg die menschlich verfassten Texte. Die Ergebnisse zur Fachkenntnis zeigen, 
dass menschlich verfasste Texte bei Sport-, Lokal-, und Finanzthemen bevorzugt werden, 
computergenerierte Texte hingegen bei Konferenzberichten. Insgesamt wird die Fachkenntnis 
der menschlich verfassten Texte bei den Politik- und Finanzthemen in beiden Teilexperimen- 
ten signifikant höher bewertet, als deren automatisiert generierte Vergleichstexte (vgl. ebd.: 
2622). 

58 Für das Experiment hat ein Journalist eine objektive, informierende und eine nicht- 
objektive, meinungsbildende Textversion erstellt, indem er in der nicht-objektiven Version 
z. B. wertende Worte eingefügt hat (vgl. Tandoc Jr. et al. 2020: 554). 
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nicht aber bei der Publikation und der Kennzeichnung aufzeigen. Außerdem werden 
mögliche Interaktionseffekte zwischen allen drei unabhängigen Variablen getestet 
und unterschiedliche Wirkung auf die abhängigen Variablen festgestellt (vgl. ebd.: 
270£.). Da die Ergebnisse der Variablen eng miteinander verbunden sind und diese 
bereits bei der Aufarbeitung der Kennzeichnung ausführlich besprochen sind, sei auf 
den Abschnitt zum Einfluss der Kennzeichnung verwiesen (vgl. Abschnitt 5.2.4). 


Ergebnisse der vermittelnden und moderierende Variablen 

Vermittelnde und moderierende Variablen können nicht losgelöst vom Studiende- 
sign und der Konzeption der unabhängigen und abhängigen Variablen betrachtet 
werden. Überwiegend werden die Einflüsse dieser Variablen deshalb bereits in der 
Aufarbeitung der unabhängigen Variablen angesprochen und sollen im Folgenden 
je Variable zusammengefasst werden. Tabelle 5.1 zeigt die Übersicht über die ver- 
wendeten vermittelnden und moderierenden Variablen, deren Aufarbeitung insbe- 
sondere für die Exploration weiterer möglicher Einflussfaktoren auf die Vertrauens- 
bewertung automatisiert generierter Nachrichten relevant ist. 

Wölker und Powell (2018) nutzen die bewertete Text- und Quellenglaubwürdig- 
keit der Stimuli zunächst als abhängige Variable. An mehreren Stellen der Aufar- 
beitung ist aber bereits erwähnt, dass die Autor:innen zudem testen, wie die Glaub- 
würdigkeitsbewertung die Nachrichtenauswahl von automatisiert generierten Sti- 
muli beeinflusst. Hier sind also die Textquelle als unabhängige, die Selektivität 
als abhängige und Text- und Quellenglaubwürdigkeit als vermittelnde Variablen 
angelegt (vgl. Wölker und Powell 2018: 10f., Appendix). In den Ergebnissen zei- 
gen Wölker und Powell (ebd.) dass, unabhängig davon, wie die Bewertung der Text- 
und Quellenglaubwürdigkeit von automatisiert generierten, hybriden und mensch- 
lich verfassten Stimuli ausfällt, sich die Selektivität von automatisiert generierten 
Texten nicht ändert (vgl. ebd.: 10). 

Waddell (2018) untersucht den Einfluss der Kennzeichnung auf die Textglaub- 
würdigkeit und die wahrgenommene Wichtigkeit des Nachrichtenthemas in Ver- 
bindung mit vier vermittelnden Variablen: Quellen-Antropomorphismus, Maschi- 
nenheuristik, Erwartungs-Nichteinhaltung und Thema, die teilweise in Kombi- 
nationen untereinander konzipiert sind. Die Ergebnisse der vermittelnden Varia- 
blen können nicht losgelöst vom Einfluss der Kennzeichnung beschrieben werden, 
daher wurden die Aspekte bereits thematisiert und es wird auf den Abschnitt zur 


59 Die Autor:innen untersuchen zudem einen moderierenden Einfluss auf diese Zusammen- 
hänge, dazu sei auf den Folgeabschnitt verwiesen. 
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Kennzeichnung verwiesen‘. Zusammengefasst lauten die Ergebnisse, dass Quellen- 
Antropomorphmismus die Beziehung zwischen der unabhängigen und den abhängi- 
gen Variablen erklären kann: Lesende sehen Algorithmen als Autor:innen als weni- 
ger antropomorph an und dadurch wird die Textglaubwürdigkeit und Issue Import- 
ance von automatisiert generierten Texten geringer bewertet. Die Maschinenheuris- 
tik wird als Vermittler in Kombination mit der Erwartungs-Nichteinhaltung getestet, 
hier können keine signifikanten Unterschiede festgestellt werden. Die Erwartungs- 
Nichteinhaltung wird weiterhin mit Quellen-Antropomorphismus zusammen unter- 
sucht, auch hier sind keine vermittelnden Wirkungen dokumentiert. Zusätzlich wird 
getestet, ob die Kombination der drei vermittelnden Variablen und unter Einführung 
des moderierenden Faktors Robot-Recall Einfluss auf die abhängigen Variablen hat. 
Dieser Zusammenhang wurde bestätigt. Das Thema führt Waddell (ebd.) zwar als 
vierten Mediator ein, testet dies aber unabhängig von den bisherigen Hypothesen. 
Er konnte keinen Einfluss der Stimulithemen ausmachen (vgl. ebd.: 248). 

Waddell (2019) prüft zudem die Kennzeichnung als unabhängige, die Textglaub- 
würdigkeit als abhängige und Quellen-Antropomorphismus und Nachrichtenbias 
jeweils als vermittelnde Variablen. Auch hier sind die Ergebnisse in den bisherigen 
Ausführungen zu den Studienergebnissen bereits beschrieben. Zusammengefasst 
erbringen beide Variablen signifikante Erklärleistung bezogen auf die Beziehung 
zwischen der unabhängigen und der abhängigen Variable, indem bei der Wahr- 
nehmung automatisiert generierter Nachrichten ein positiver Effekt durch die ver- 
mittelnde Variable Nachrichtenbias sowie ein negativer vermittelnder Effekt durch 
Quellen-Antropomorphismus festzustellen ist (vgl. ebd.: 9-12). 

Zunächst führen Liu und Wei (2019) als moderierende Variable die journalis- 
tische Darstellungsform und die Publikation ein®'. Moderationseffekte können bei 
beiden Variablen jeweils teilweise nachgewiesen werden: Bei der journalistischen 
Darstellungsform treten moderierende Effekte nur bei der bewerteten Textglaub- 
würdigkeit auf, wogegen bei der Publikation signifikante Moderationseffekte bei der 
Objektivität, der Vertrauenswürdigkeit der Quelle und der zugeschriebenen Fach- 
kenntnis der Quelle, nicht aber bei der Textglaubwürdigkeit festzustellen sind (vgl. 


60 Insgesamt werden automatisiert generiert gekennzeichnete Texte als weniger glaubwürdig 
eingeschätzt (vgl. Waddell 2018: 247 f.). 

6l Bei beiden Variablen wird im Experiment überprüft, ob und wenn ja wie, die Beziehung 
zwischen der Kennzeichnung (als unabhängige Variable) und der Wahrnehmung computer- 
generierter Texte beeinflusst wird. Die Wahrnehmung wird gemessen als Objektivität, Text- 
glaubwürdigkeit, Vertrauenswürdigkeit der Quelle und der zugeschriebenen Fachkenntnis der 
Quelle (vgl. Konzeption der Studien in Tabelle 9.3 im Anhang ‚Forschungsstand Rezeptions- 
studien‘ im elektronischen Zusatzmaterial). 
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ebd.: 648f.). Die Ergebnisse zu beiden moderierenden Variablen sind ausführlich 
im Abschnitt zum Einfluss der Kennzeichnung beschrieben. 

Auch Waddell (2019) untersucht die Publikation als moderierende Variable, 
dabei werden, im Gegensatz zu Liu und Wei (2019), keine eigenständigen Hypo- 
thesen berücksichtigt, sondern in zusätzlichen Auswertungen Moderationseffekte 
auf die abhängigen Variablen (Glaubwürdigkeit, Nachrichtenbias und Quellen- 
Antropomorphismus) getestet. Der Autor kann, anders als Liu und Wei (ebd.) kei- 
nen Einfluss der Publikation feststellen. Ebenso testet er mögliche moderierende 
Einflüsse des Themas und konnte auch hier keine signifikanten Unterschiede zwi- 
schen den Experimentalgruppen feststellen (vgl. Waddell 2019: 10f.). In der Arbeit 
von Waddell (2018) wird der Robot-Recall, also das Erinnerungsvermögen an eine 
Mediendarstellung eines Roboters, als moderierende Variable eingeführt. Dabei 
kann moderierende Wirkung nachgewiesen werden: mit der Erinnerung an eine 
solche Mediendarstellung wird der Quellen-Antropomorphismus beeinflusst wird, 
was sich wiederum auf die Wahrnehmung auswirkt (vgl. ebd.: 247 f.). Im Detail 
sind die Ergebnisse im Abschnitt zum Einfluss der Kennzeichnung (vgl. Abschnitt 
zur Kennzeichnung 5.2.4) beschrieben. Weiterhin untersuchen Haim und Graefe 
(2018a), ob die Wahrnehmung computergenerierter Texte durch das Themeninvol- 
vement moderiert wird. Die Autoren können zwischen den Experimentalgruppen 
keine signifikanten Moderationseffekte feststellen (vgl. ebd.: 200). Wölker und 
Powell (2018) untersuchen die Vorkenntnisse der Proband:innen zum automati- 
sierten Journalismus und den Medienkonsum von Nachrichten zu den Themen der 
Stimuli teilweise als moderierende Variablen. Die Auswertung der moderierenden 
Variablen zeigt nur in drei Bedingungen überhaupt signifikante Einflüsse der mode- 
rierenden Variablen. Zunächst wirken Vorkenntnisse zum automatisierten Journa- 
lismus auf die Beziehung zwischen hybrid gekennzeichneten Finanztexten und der 
bewerteten Quellenglaubwürdigkeit (ebd.: 10f.). Außerdem können Moderations- 
effekte durch den Medienkonsum in zwei Fällen nachgewiesen werden: Einmal 
moderiert der Medienkonsum von Finanzthemen bei computergenerierten Stimuli 
die bewertete Quellenglaubwürdigkeit und die Beziehung zwischen der bewerteten 
Quellenglaubwürdigkeit als vermittelnde Variable und die Selektivität von com- 
putergenerierten Texten als abhängige Variable. In den weiteren Bedingungen und 
getesteten Beziehungen sind keine Moderationseffekte durch den Medienkonsum 
oder durch Vorkenntnisse zum automatisierten Journalismus festzustellen (Wölker 
und Powell 2018: 10f.). 


Ergebnisse der Kontrollvariablen 

Die Kontrollvariablen werden im Folgenden nach Struktur der Tabelle 5.1 bespro- 
chen. Zunächst sind Faktoren aufgelistet, die im Rahmen der Pre-Exposure- 
Befragung erhoben werden und im Wesentlichen dazu dienen, die Gruppe der 
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Proband:innen beziehungsweise deren Verteilung zu dokumentieren. Danach sind 
die Variablen aufgeführt, die als Kontrollvariablen untersucht werden, es folgen wei- 
terführende Analysen zu den Teilnehmenden, sowie abschließend sind Angaben zu 
den Stimuli und zum experimentellen Setting dargestellt. 

Grundsätzlich erheben alle Autor:innen, meist in Vorabbefragungen, demogra- 
phische Merkmale, wie zum Beispiel Geschlecht, Alter, Bildungsstand, politische 
Einstellung, oder Ethnie. Das Durchschnittsalter der Teilnehmenden liegt bei 34 
Jahren und die Geschlechterverteilung ist summiert mit 54 Prozent weibliche Teil- 
nehmerinnen anzugeben (vgl. Tabelle zum Studienüberblick im Anhang 9.3)). Jia 
(2020) befragen die Teilnehmenden auch, ob sie bereits Erfahrungen mit chine- 
sischer automatisierter Berichterstattung haben. Hier antworten 33,3 Prozent der 
Befragten mit ‚ja‘. Eine Analyse des Einflusses der Vorerfahrungen findet nicht 
statt. Außerdem stellen Liu und Wei (2019) einen Einfluss der politischen Einstel- 
lung der Proband:innen auf die Bewertung des ‘Emotional Involvements’ hervor 
und verwenden politische Nachrichtentexte als Stimuli (vgl. ebd.: 643 f.)$?. Diffe- 
renzierte Auswertungen zu den demografischen Merkmalen sind im Wesentlichen 
nur bei Melin et al. (2018) dokumentiert. Hier zeigen die Autor:innen zwei Wir- 
kungsweisen auf: Im Experiment können die Teilnehmenden aus einem Pool an 
Texten vier Stimuli selbst wählen und diese evaluieren. Hier zeigen sich deutliche 
Unterschiede bei der kombinierten Auswertung von Geschlecht und Alter: Junge 
Frauen vergeben die niedrigsten Zustimmungswerte wogegen ältere Männer die 
höchsten Bewertungen der abhängigen Variablen angeben. Zudem lassen die For- 
schenden bei den ersten zehn ihrer ungekennzeichneten Stimuli die Quellen raten 
und auch hier zeigen sich Unterschiede in Abhängigkeit des Geschlechts: Män- 
ner erkennen die Muster computergenerierter Texte nach weniger Stimulitexten, 
machen aber mehr Fehler bei der Zuordnung. Frauen hingegen erkennen die com- 
putergenerierten Stimuli später, können dann aber die Quellen der folgenden Stimuli 
zuverlässiger und mit weniger Fehler bestimmen. Außerdem werden die Probanden 
bei Melin et al. (ebd.) vor Aussetzen der Stimuli befragt, welche der abhängigen 
Variablen für sie am wichtigsten sind. In absteigender Reihenfolge bewerten die 
Proband:innen die Glaubwürdigkeit, die Qualität, dann die Repräsentativität und 
abschließend die Vorliebe. Diese Reihenfolge verändert sich nicht, wenn Geschlecht 
und Lesegewohnheiten gesondert analysiert werden (vgl. ebd.: 43363). 

Widersprüchliche Ergebnisse gibt es beim erfragten Mediennutzungsverhalten 
beziehungsweise dem Nachrichtenkonsum sowie bei den Vorerfahrungen mit Auto- 
matisierungen. Zunächst können Graefe, Haim et al. (2018) keinen Einfluss des 


62 Emotional Involvement ist die abhängige Variable der ersten Hypothese. Diese Ergebnisse 
sind nur am Rande Gegenstand dieser Arbeit. 
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Mediennutzungsverhaltens auf die Wahrnehmung computergenerierter Nachrichten 
feststellen, wogegen Tandoc Jr. et al. (2020) auf einen positiven Zusammenhang zwi- 
schen Nachrichtenkonsum und der bewerteten Text- und Quellenglaubwürdigkeit 
hinweisen (vgl. ebd.: 9). Auch Melin et al. (2018) zeigen in einer kombinierten Aus- 
wertung aus Lesegewohnheiten und Vorerfahrungen mit automatisierter Berichter- 
stattung auf Veränderungen in der Bewertung auf: Proband:innen, die viel lesen und 
mit automatisiertem Journalismus vertraut sind, bewerten die automatisiert gene- 
rierten Stimuli jeweils mit hohen Werten der Glaubwürdigkeit, Vorliebe, Qualität 
und Repräsentativität. Wogegen Viellesende, die mit automatisierter Berichterstat- 
tung nicht vertraut sind, für die automatisiert generierten Stimuli die niedrigsten 
Bewertungen der abhängigen Variable vergeben. Erfahrungen mit Automatisierun- 
gen haben bei Tandoc Jr. et al. (2020) keinen Einfluss auf die abhängigen Varia- 
blen, bei Jia (2020) sind diese — wie beschrieben -, lediglich zur Dokumentation 
der Teilnehmenden erfasst und Wölker und Powell (2018) operationalisieren die 
Vorerfahrungen als moderierende Variable und zeigen teilweise Einflüsse auf die 
Wahrnehmung der Stimuli (siehe Ergebnisse moderierende Variablen). In der Stu- 
die von Graefe, Haim et al. (2018) werden die Teilnehmenden außerdem zu ihrem 
Interesse an den Themen der Stimuli befragt und Liu und Wei (2019) erheben mit 
ähnlichem Ziel das Involvement der Proband:innen zu den Stimulithemen. In beiden 
Arbeiten kann kein Einfluss des Themeninteresses auf die Bewertung festgestellt 
werden. Außerdem fragen Graefe, Haim et al. (2018) nach dem journalistischen 
Hintergrundwissen der Teilnehmenden und können keine Ergebnisse ausmachen 
(vgl. ebd.: 8). 

Weiterhin nutzen Zheng et al. (2018), Haim und Graefe (2018a) und Van der 
Kaa und Krahmer (2014) das Thema als Kontrollvariable. Für den Einfluss oder 
die Wirkung des Themas sei auf die bisher erarbeiteten Ergebnisse hingewiesen, 
die das Thema stärker in den Fokus genommen und beispielsweise als unabhängige 
oder vermittelnde Variable operationalisiert haben. Dennoch: Nur Van der Kaa und 
Krahmer (2014) können in zusätzlichen Analysen einen Einfluss des Themas auf 
die bewertete Vertrauenswürdigkeit aufzeigen. Sportnachrichten werden demnach 
in diesem Experiment als weniger vertrauenswürdig bewertet als Finanztexte (vgl. 
ebd.: 3). Sowohl Haim und Graefe (2018a) als auch Zheng et al. (2018) stellen 
keine weiteren Auswirkungen des Themas fest. Abschließend sei noch darauf hin- 
gewiesen, dass Waddell (2019) eine mögliche Wirkung der Art der algorithmischen 
Kennzeichnung sowie einen Einfluss der hybriden Kennzeichnung untersucht hat. 
Außerdem haben Waddell (2019), Melin et al. (2018) mögliche Auswirkungen der 
Reihenfolge der Stimulitexte untersucht hat. Beide Studien konnten keine weiteren 
Wirkungsweisen dokumentieren. 
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Insgesamt sind die Ergebnisse bezogen auf die vermittelnden und moderieren- 
den Faktoren gering: Keine signifikanten Unterschiede bei der Berücksichtigung 
von vermittelnden Faktoren können Wölker und Powell (2018) in Bezug auf die 
Text- und Quellenglaubwürdigkeit sowie Waddell (2018) mit Thema, Maschinen- 
heuristik und der Erwartungs-Nichteinhaltung ermitteln. Zumindest teilweise gibt 
es vermittelnde Erklärleistung zwischen abhängigen und unabhängigen Variablen 
bezogen auf Quellen-Antropomorphismus (vgl. Waddell 2018: 245; Waddell 2019: 
10) sowie bezogen auf Nachrichtenbias (vgl. Waddell 2019: 10). Weiterhin keine 
Moderationseffekte kann Waddell (ebd.) in Bezug auf das Thema und die Publika- 
tion feststellen (vgl. ebd.: 10f.) sowie keine Effekte sehen auch Haim und Graefe 
(2018a) bezogen auf das Themeninvolvement (vgl. ebd.: 200). Teilweise stellen hin- 
gegen Liu und Wei (2019) Moderationseffekte bei der Publikation sowie in Bezug 
zur journalistischen Darstellungsform fest (vgl. ebd.: 648 f.). Waddell (2018) kann 
moderierende Effekte durch den Robot-Recall aufzeigen (vgl. ebd.: 247 f.) und Wöl- 
ker und Powell (2018) weisen in einzelnen Bedingungen des Experiments indirekte 
Effekte durch Vorkenntnisse zum automatisierten Journalismus und zum Medien- 
konsum von Sport- und Finanzthemen nach (vgl. ebd.: 20f.). 


Ausgewählte Ergebnisse zu den Studienschwerpunkten 

In den Rezeptionsstudien wurden vier Schwerpunkte ausgemacht: Dies sind A) 
die Frage, ob Proband:innen die Textquelle zuordnen können, B) die zusätzliche 
Erhebung der Erwartung an automatisierten Journalismus, C) der bewusste und 
unbewusste Vergleich zwischen automatisiert generierten und menschlich verfass- 
ten Texten sowie D) der Einfluss des kulturellen Hintergrunds der Teilnehmen- 
den (vgl. Abschnitt 5.2.1). Diese Ergebnisse zu den Schwerpunkten wurden in der 
Einzeldarstellung der Studienergebnisse bereits besprochen, sollen zum besseren 
Überblick noch einmal gesondert zusammengefasst werden. 


Zuordnenbarkeit der Quelle 

Bei den Ergebnissen zum Einfluss der Textquelle wurde bereits erwähnt, dass 
Lesende A) den Ursprung der Texte nicht identifizieren Können, z. B.: (vgl. Melin 
et al. 2018: 43362; Clerwall 2014: 526). Das kann an den einfachen Routinetexten 
als Stimuli liegen (vgl. Graefe, Haim et al. 2018: 10) und muss mit fortschreitender 
Verbesserung NLG-Technologie weiter beobachtet werden. Mit den bisher geteste- 
ten Nachrichten als Stimuli ist eine eindeutige Zuordnung, ob ein Text menschlich 
verfasst oder algorithmisiert generiert wurde, nicht möglich. 
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Einfluss der Erwartungen 

Neben der Wahrnehmung werden zusätzlich die B) Erwartungen an automatisiert 
generierte Nachrichten bei Haim und Graefe (2017), Graefe, Haim et al. (2018), 
Jia (2020) und Waddell (2018) thematisiert (vgl. dazu Tabelle 9.3 im Anhang ‚For- 
schungsstand Rezeptionsstudien‘ im elektronischen Zusatzmaterial). Dazu erheben 
Haim und Graefe (2017) in zwei Teilexperimenten zunächst die Erwartungen an 
beide Textarten: Ohne einen Vergleich beider Textarten sind die Erwartungen an 
menschlich verfasste Texte in allen drei Dimensionen höher als an computergene- 
rierte Texte. Wenn ein Vergleich beider Textarten möglich ist, sind die Erwartungen 
an menschlich geschriebene Nachrichten bezogen auf die Lesbarkeit und Qualität 
höher, bei der Glaubwürdigkeit aber werden maschinengeschriebene Texte bevor- 
zugt. Diese Ergebnisse überraschen, da die Erhebung der Erwartungen in beiden 
Experimenten über eine Vorabbefragung, also vor Aussetzen der Stimuli erfolgt 
und der Aufbau der Experimente bis zu diesem Zeitpunkt nicht unterscheidbar ist. 
Weiterhin werten Haim und Graefe (ebd.) aus, inwiefern die Erwartungen an die 
verschiedenen Texte mit der erhobenen Wahrnehmung bestätigt oder nicht bestä- 
tigt werden. Insgesamt werden die Erwartungen an die abhängigen Variablen in 
keiner Textart erfüllt. Die Richtung der Ergebnisse ist bei beiden Experimenten 
gleich, die einzelnen Werte unterscheiden sich aber (vgl. ebd.: 1052-1055). Auch 
Graefe, Haim et al. (2018) sehen ihre Vermutungen hinsichtlich eines Einflusses 
der Erwartungen der Lesenden auf die tatsächliche Bewertung nicht bestätigt. Eine 
ihrer Annahme war, dass geringe Erwartungen an automatisierte Texte beim Lesen 
der Stimuli übertroffen werden und dadurch positiv(ere) Bewertungen zur Folge 
haben. Und bei menschlich verfassten Texten im Umkehrschluss hohe Erwartungen 
während des Lesens nicht erfüllt werden und damit durchweg negativere Bewertun- 
gen abgegeben werden. Wenn beide Vermutungen zutreffen würden, dann müssten 
menschlich verfasste Nachrichten positiver bewertet werden, wenn sie fälschlicher- 
weise als maschinengeschrieben gekennzeichnet werden und umgekehrt maschi- 
nengeschriebene Nachrichten negativer, wenn sie als menschlich geschriebene Texte 
gekennzeichnet sind. Aber Graefe, Haim et al. (ebd.) zeigen, dass das Gegenteil der 
Fall ist: Menschlich verfasste Texte werden negativer bewertet, wenn sie als automa- 
tisiert generiert gekennzeichnet sind und algorithmisierte Stimuli werden positiver 
bewertet, wenn sie als menschlich verfasste Texte ausgewiesen werden (vgl. ebd.: 
9-11). 


63 Zusätzlich merken die Autoren bei Experiment Zwei an, dass die Wahrnehmungen automa- 
tisierter Texte nicht negativ, sondern neutral ausfällt. Die Nachrichten werden weder besonders 
euphorisch betrachtet noch wird ihnen mit großer Skepsis begegnet (vgl. Haim und Graefe 
2017: 1054). 
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Dagegen zeigt die kombinierte Auswertung von Erwartungen®* und Wahrneh- 
mungen bei Jia (2020), dass die tatsächliche Bewertung der menschlich verfass- 
ten Texte nicht den zuvor geäußerten Erwartungen entspricht und die Wahrneh- 
mung der automatisiert generierten Texte hingegen die Erwartungen der Lesenden 
in den Experimenten übertreffen (vgl. ebd.: 2618-2624). Zudem untersucht Wad- 
dell (2018) die Enttäuschung von Erwartungen gegenüber automatisiert generierten 
Nachrichten als möglichen vermittelnden Faktor auf die Beziehung zwischen der 
Kennzeichnung als unabhängige und die Textglaubwürdigkeit als abhängige Varia- 
ble. Einen vermittelnden Einfluss von enttäuschten Erwartungen kann der Autor 
nur in einer von vier Hypothesen und nur in Kombination mit der moderierenden 
Variable des Robot-Recalls beobachten (vgl. Waddell 2018: 247 f.). 

Insgesamt zeigen die bisherigen Studienergebnisse, dass Lesende weder beson- 
ders positive noch besonders negative Erwartungen an automatisiert generierte 
Nachrichten haben und die Erwartungen im Vergleich beider Textquellen nur leichte 
Unterschiede aufweisen. Die Vermutung einiger Autor:innen, dass die Erwartung an 
automatisiert generierte Nachrichten negativ ausfällt und die tatsächliche Bewertung 
der Lesenden dann durch einen positiven Überraschungseffekt deutlich günstiger 
ausfällt, konnte nicht beziehungsweise nur in wenigen Detailergebnissen bestätigt 
werden (vgl. Graefe, Haim et al. 2018: 149; Jia 2020). Insgesamt zeigen die weni- 
gen Studien, „dass die Bewertung computergenerierter Texte nur bedingt von den 
Erwartungen der Befragten abhängt“ (Haim und Graefe 2018b: 149). 


64 Zunächst äußern die Befragten in den beiden Textexperimenten die gleichen Erwartun- 
gen gegenüber beiden Textquellen. Dies ist nicht weiter erstaunlich ist, da die Erwartungen 
über eine Vorabbefragung erfolgt und der Versuchsaufbau beider Experimente bis dato gleich 
ist. Überraschend sind hier eher — wie oben beschrieben — die Ergebnisse von Haim und 
Graefe (ebd.). Vermutet hat Jia (2020), dass die Erwartungen der Proband:innen an mensch- 
lich verfasste Texte höher sind als an computergenerierte Stimuli. Die Hypothese wird für 
die Dimensionen Fachkenntnis und Lesbarkeit bestätigt, bei der Glaubwürdigkeit hingegen 
sind die Erwartungen zwar auch minimal höher, allerdings ist der Unterschied zwischen den 
Textquellen zu gering für statistisch relevante Aussagen (vgl. ebd.: 2618f., 2621-2624). 


65 Die Ergebnisse im Detail: Bei menschlich verfassten Texten werden Lesbarkeit und Fach- 
kenntnis geringer wahrgenommen als zuvor geäußerte Erwartungen. Die Glaubwürdigkeit 
hingegen übertrifft die Erwartungen und wird als relevant höher eingeschätzt. Bei algorithmi- 
sierten Berichterstattung gibt es Unterschiede zwischen den durchgeführten Teilexperimen- 
ten: In Experiment Eins wird die wahrgenommene Lesbarkeit zwar als höher, aber nicht als 
signifikant höher bewertet, bei der Fachkenntnis ergeben sich keine Unterschiede zwischen 
Erwartung und Wahrnehmung. Die Glaubwürdigkeit wird als signifikant höher bewertet, als 
die diesbezüglichen Erwartungen (vgl. Jia 2020: 2618-2620). In Experiment Zwei wird die 
Lesbarkeit wieder als leicht, aber nicht signifikant höher wahrgenommen, die Fachkenntnis 
hingegen als signifikant höher und die Glaubwürdigkeit höher, aber wieder nicht als signifikant 
höher wahrgenommen (vgl. ebd.: 2621-2624). 
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Einfluss des bewussten oder unbewussten Textvergleichs 

Jia (2020) legt C) im ersten Experiment keinen Vergleich zwischen menschlich ver- 
fassten und computergenerierten Texten an und in der zweiten Erhebung vergleichen 
die Proband:innen beide Textsorten unbewusst. Die Veränderung des Studiendesigns 
hat keinen Einfluss auf die bewertete Glaubwürdigkeit. Die Lesbarkeit und Fach- 
kenntnis wird hingegen bei menschlich verfassten Texten höher bewertet, wenn den 
Proband:innen beide Textarten vorlagen (vgl. ebd.: 2623). Bei Wus (2020) lesen die 
Proband:innen immer einen menschlich verfassten und einen computergenerierten 
Text. Dabei sind die Stimuli in einer Experimentalgruppe immer korrekt gekenn- 
zeichnet und in der zweiten Gruppe wird keine Textquelle angegeben. Es findet 
sowohl ein bewusster als auch ein unbewusster Textvergleich statt. In der Datenaus- 
wertung beschreibt die Autorin, dass automatisiert generierte Texte als objektiver 
und glaubwürdiger wahrgenommen werden im Vergleich zu menschlich verfassten 
Texten, wenn ein unbewusster Vergleich stattfindet im Gegensatz zum bewussten 
Vergleich (vgl. ebd.: 1021). Das Studiensetting bei Melin et al. (2018) unterscheidet 
sich leicht von den anderen Erhebungen, so lesen die Proband:innen hier vierzehn 
Stimulitexte und können einen Teil davon frei wählen. Insgesamt findet ein unbe- 
wusster Vergleich zwischen computergenerierten und menschlich verfassten Texten 
statt, wobei dazu keine gesonderte Datenauswertung dokumentiert ist. Allerdings 
weisen die Autor:innen darauf hin, dass die selbst gewählten Texte deutlich höhere 
Bewertungen der Glaubwürdigkeit, der allgemeinen Qualität, der Repräsentativität 
und im Lesevergnügen erzielen (vgl. ebd.: 43360,43364). Im ersten Teilexperiment 
bei Haim und Graefe (2017) ist kein Textvergleich möglich, im zweiten Experiment 
erfolgt ein bewusster Vergleich zwischen einem jeweils korrekt gekennzeichneten 
automatisiert generierten und einen menschlich verfassten Text. In Experiment Eins 
werden keine oder sehr geringe Unterschiede in der Wahrnehmung beider Textsor- 
ten angeben. Wenn hingegen ein bewusster Vergleich möglich ist, dann wurden die 
menschlich verfassten Texte als lesbarer und die automatisiert generierten Texte als 
glaubwürdiger beschrieben. Bei der bewerteten Qualität hingegen schneiden beide 
Textarten gleich ab (vgl. ebd.: 1054)6°. 

Insgesamt zeigt sich in den bisher durchgeführten Studien kein relevanter Unter- 
schied in der Wahrnehmung computergenerierter Texte in Abhängigkeit eines 
bewussten oder unbewussten Vergleichs. Die Detailauswertung zeigt in einigen 
Aspekten Unterschiede in der Wahrnehmung der automatisierten Berichterstattung, 
sodass ein Vergleich beider Textsorten zwar keine direkte Erklärleistung für die 


66 In der Sekundäranalyse von Haim und Graefe (2018a) untersuchen die Autoren vor allem 
einen Moderationseffekt des Themeninvolvements (vgl. Abschnitt 5.2.4); in der Ergebnisdo- 
kumentation findet keine gesonderte Datenauswertung in Abhängigkeit eines Textvergleichs 
statt. 
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bewertete Glaubwürdigkeit bietet, aber möglicherweise Hinweise auf weitere offene 
Einflussfaktoren zur Wahrnehmung zeigt. Die Erwartungen werden deshalb mit als 
Einflussfaktor der vorliegenden Arbeit aufgenommen (vgl. Kapitel 6). 


Einfluss des kulturellen Hintergrunds 

Mit Jung et al. (2017), Zheng et al. (2018) und Wölker und Powell (2018) gibt es Stu- 
dien, die Wert auf einen Länder- beziehungsweise Kulturenvergleich zur Wahrneh- 
mung computergenerierter Nachrichtentexte legen. Ein solcher Vergleich ist nicht 
Gegenstand dieser Arbeit, aber die detaillierte Aufstellung der Studienergebnisse 
zeigt Unterschiede in der Wahrnehmung computergenerierter Stimuli in Abhängig- 
keit des kulturellen Hintergrunds der Befragten, zum Beispiel schreibt Jia (2020), 
dass sich ihre Studienergebnisse aus China deutlich von denen der deutschen Stu- 
dien wie Haim und Graefe (2017) unterscheiden (vgl. Jia 2020: 2624). Insgesamt 
scheint der Bewertung computergenerierter Nachrichten eine Reihe weiterer Fak- 
toren zu Grunde liegen, wie die Technologieaffinität einer Bevölkerung oder die 
generellen Zufriedenheit mit dem politischen System. 


5.3 Zusammenfassung möglicher Einflussfaktoren und 
Darlegung der Forschungslücken 


In der Literaturanalyse wurden 15 Publikationen mit 18 relevanten (Teil-)Studien zur 
Wahrnehmung computergenerierter Nachrichtentexte bei Leser:innen ohne journa- 
listischen Hintergrund aufgearbeitet. Dazu wurden jeweils das Studiensetting, die 
Konzeption der unabhängigen, abhängigen, vermittelnden, moderierenden Varia- 
blen sowie Kontrollvariablen und den Besonderheiten und Schwerpunkten der Stu- 
dien dargestellt. 

Der Fokus der ausführlichen Darstellung liegt — neben der Ergebnisdarstellung 
— gezielt auf dem Studiensetting und der Durchführung der jeweiligen Experi- 
mente, um eine breite und fundierte Basis für die weitere Exploration von Einfluss- 
faktoren auf die Wahrnehmung, und im Speziellen auf die Vertrauensbewertung, 
computergenerierter Texte zu erzielen. Die Detailanalyse konnte dabei zwar eine 
grundsätzliche Vergleichbarkeit der Studien - sie sind alle als Online-Experimente 
mit Stimulitexten und einer anschließenden Befragung konzipiert — aufzeigen, im 
Detail unterscheiden sich die Studien aber teilweise deutlich. Es werden sowohl 
gekennzeichnete als auch nicht gekennzeichnete computergenerierte, menschlich 
verfasste und hybrid erstellte Nachrichtentexte verwendet. Die Themen der Artikel 
sind beispielsweise Sport, Finanzen oder Lokalnachrichten. In einigen Arbeiten kön- 
nen die Proband:innen computergenerierte und menschlich verfasste Texte bewusst 
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vergleichen, in anderen findet ein unbewusster oder kein Vergleich statt. Neben 
der Wahrnehmung der Stimuli werden in einigen Arbeiten zusätzlich die Erwar- 
tungen an computergenerierte Texte erhoben und ihr Einfluss auf die Bewertung 
der Texte ausgewertet. Zusätzlich gibt es weitere Schwerpunkte, wie einen geziel- 
ten Ländervergleich oder die Frage, ob die Lesenden die Quelle der Nachrichten 
eindeutig zuordnen können. Umfangreich sind außerdem die verwendeten unabhän- 
gigen, abhängen und weiteren Variablen thematisiert worden. Im Mittelpunkt der 
Rezeptionsstudien steht der Einfluss des Textursprungs, der Autorenkennzeichnung 
sowie der verwendeten Themen. Diese drei unabhängigen Variablen werden - in 
unterschiedlichen Kombinationen - in allen 18 Teilstudien untersucht. Als abhän- 
gige Variable werden in der Regel die Text- und Quellenglaubwürdigkeit operatio- 
nalisiert, die meist durch die bewertete Fachkenntnis, die Lesbarkeit oder Qualität 
ergänzt werden. Vertrauen wird nicht in allen Arbeiten explizit berücksichtigt und 
findet nur teilweise als Indikator der Glaubwürdigkeit oder als eigenständiges Item 
Berücksichtigung. 

Insgesamt können die Studienergebnisse zeigen, dass sowohl menschlich ver- 
fasste, als auch maschinengeschriebene und hybrid erzeugte Nachrichtentexte bezo- 
gen auf Textquelle und -inhalt als zufriedenstellend glaubwürdig bewertet werden. 
Dabei können Lesende nicht eindeutig zuordnen, welchen Ursprung die Texte haben. 
Dazu trägt möglicherweise auch die begrenzte Themenauswahl der Stimulitexte bei 
(vgl. Graefe, Haim et al. 2018: 596). Acht von neun Studien zeigen einen Einfluss der 
Textquelle auf die Wahrnehmung computergenerierter oder hybrider Texte. Zwar 
sind die Unterschiede zwischen beiden Textarten gering und in einigen Studien 
durchaus widersprüchlich, in der Regel werden menschlich verfasste Texte aber 
als lesbarer und computergenerierte Texte als objektiver und teilweise als glaub- 
würdiger wahrgenommen. In der Aufarbeitung wird außerdem deutlich, dass die 
Textquelle im Vergleich zu den weiteren unabhängigen Variablen den deutlichs- 
ten Einfluss auf die Wahrnehmung hat. Sichtbar wird auch, dass die Effekte im 
Wesentlichen nicht losgelöst von vermittelnden und moderierenden Variablen und 
auch nicht unabhängig vom konkreten Studiensetting ausgewertet werden können. 
Neben dem Textursprung werden weiterhin die Effekte der Kennzeichnung gemes- 
sen. Damit ist gemeint, ob der Ursprung der Texte überhaupt gekennzeichnet wurde 
und wenn ja, ob die Kennzeichnung korrekt oder manipuliert angegeben wurde, 
zum Beispiel, ob die Quelle von maschinengeschriebenen Texte auch dementspre- 
chend angegeben wurde. Insgesamt sind die Effekte der Kennzeichnung weniger 
deutlich zu messen als der Einfluss der Textquelle. Zudem gibt es lediglich verein- 
zelt Arbeiten, die nur einen Effekt der Kennzeichnung berücksichtigen, da auch hier 
meist zusätzlich vermittelnde oder moderierende Variablen mitberücksichtigt wer- 
den. Zusätzlich zeigen Arbeiten, dass das Thema der Stimulitexte, die Objektivität 
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der Nachrichten und die Publikation, in der die Artikel erscheinen, wenig bis keine 
Auswirkungen auf die Wahrnehmung computergenerierter Texte haben. Lediglich 
der kulturelle Hintergrund der Teilnehmenden scheint Einfluss zu haben. Mögli- 
cherweise ist Kultur aber ein übergeordnetes Konzept und relevant sind vielmehr 
Ausschnitte davon: Beispielsweise wird in einigen Arbeiten aus dem kulturellen 
Hintergrund heraus die Technologieaufgeschlossenheit oder das allgemeine Jour- 
nalismusvertrauen antizipiert. 

Konkret bezogen auf Vertrauen oder Vertrauensentscheidungen in Bezug zu auto- 
matisiert generierten Nachrichten gibt es lediglich erste kleinteilige Ergebnisse, 
indem Vertrauen meist als Indikator für Glaubwürdigkeit erhoben wurde. Weitere 
Ergebnisse zum Vertrauen in automatisiert generierte Nachrichten, zu den Ein- 
flussfaktoren auf diese Vertrauensbewertung oder eine intensive wissenschaftliche 
Begleitung des Entscheidungsprozesses gibt es nicht. Wie bereits die Darstellung des 
Vertrauenskonzepts in Kapitel 4 zeigt, sind Glaubwürdigkeit und Vertrauen eng ver- 
wandte Konzepte der Medienbewertungsforschung. Beides sind zudem komplexe 
soziale Konstrukte und eine Glaubwürdigkeits- oder eine Vertrauensentscheidung 
ist ein mehrdimensionaler Prozess, bei dem monokausale Erklärungen oder Ein- 
flussfaktoren zu kurz greifen. Dies spiegelt auch die Aufarbeitung des bisherigen 
Forschungsstands zur Wahrnehmung — und dazu im Speziellen zur Glaubwürdig- 
keitsbewertung — automatisierter Berichterstattung wider: Bisher sind eine Reihe 
unterschiedlicher Einflussfaktoren getestet worden, die in unterschiedlichen Set- 
tings und mit einer Variation an Variablen im Wesentlichen zwar ähnliche Ergeb- 
nisse liefern, aber im Detail differenzierte Befunde zeigen. 

Für das Forschungsziel der Exploration der Vertrauensbewertung in automatisier- 
ten Journalismus ist die Aufarbeitung zielführend, um eine breite Basis an möglichen 
Einflussfaktoren auf Vertrauensentscheidung zu generieren. Aus der Aufarbeitung 
der Studiensettings wird geschlussfolgert, dass eine intensive Auseinandersetzung 
mit der Vertrauensbewertung des automatisierten Journalismus notwendig ist. Dazu 
werden Ergebnisse losgelöst von konkreten einzelnen Stimulitexte generiert, die 
auch über eine fortschreitende technologische Entwicklung der Algorithmen hin 
valide bleiben. Zudem wird in dieser Arbeit, im Gegensatz zu den bisherigen Erhe- 
bungsdesigns der quantitativen Befragungen, ein qualitatives Vorgehen mit gezielter 
Exploration gewählt. 

Für die vorliegende Arbeit wird aus dem Forschungsstand der mögliche Ein- 
fluss gekennzeichneter Texte und das Wissen um die Existenz computergenerierter 
Nachrichten übernommen. Außerdem werden die mögliche Relevanz des Nachrich- 
tenthemas, der Darstellungsform und der Publikation, in der computergenerierte 
Berichterstattung veröffentlicht wird, berücksichtigt. Des Weiteren wird die Rezep- 
tion von Roboterdarstellungen in den Medien, in Anlehnung an den Robot-Recall 
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Abbildung 5.1 Einflussfaktoren aus dem Forschungsstand zur Glaubwürdigkeit computer- 
generierter Nachrichtentexte. (Eigene Darstellung in Anlehnung an Clerwall (2014), Van der 
Kaa und Krahmer (2014), Jung et al. (2017), Haim und Graefe (2017), Graefe, Haim et al. 
(2018), Wölker und Powell (2018), Waddell (2018), Zheng et al. (2018), Melin et al. (2018), 
Liu und Wei (2019), Waddell (2019), Wus (2020), Jia (2020), Tandoc Jr. et al. (2020) und 
Haim und Graefe (2018a)) 


von Waddell (2019), auf die Vertrauensbewertung des automatisierten Journalismus 
thematisiert (vgl. Zusammenfassung und Ableitung Forschungsmodell in Kapitel 6). 
Auch die Erwartungen an automatisierten Journalismus und mögliche Erwartungs- 
Nichteinhaltungen werden besprochen. Kontrolliert und abgefragt werden demo- 
grafische Merkmale, der kulturelle Hintergrund, journalistisches Hintergrundwis- 
sen und die Vorerfahrung mit automatisierter Berichterstattung. Diese Einflussfak- 
toren sind in Abbildung 5.1 zusammenfassend dargestellt. Aus dem Forschungs- 
stand nicht berücksichtigt werden die Variation der Textquelle und der Medien- 
konsum zu den Themen der verwendeten Stimuli, da es um das Bezugsobjekt des 
automatisierten Journalismus und nicht um einen direkten Vergleich von Stimuli- 
texten geht. Weiterhin nicht berücksichtigt werden Quellen-Antropomorphismus, 
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Nachrichtenbias und Maschinenheuristik. Hier wurden in den bisherigen Studien 
keine oder teilweise vermittelnde Einflüsse festgestellt und müssen gegebenenfalls 
in Folgestudien adressiert werden. 


Open Access Dieses Kapitel wird unter der Creative Commons Namensnennung 4.0 Inter- 
national Lizenz (http://creativecommons.org/licenses/by/4.0/deed.de) veröffentlicht, wel- 
che die Nutzung, Vervielfältigung, Bearbeitung, Verbreitung und Wiedergabe in jeglichem 
Medium und Format erlaubt, sofern Sie den/die ursprünglichen Autor(en) und die Quelle 
ordnungsgemäß nennen, einen Link zur Creative Commons Lizenz beifügen und angeben, 
ob Änderungen vorgenommen wurden. 

Die in diesem Kapitel enthaltenen Bilder und sonstiges Drittmaterial unterliegen eben- 
falls der genannten Creative Commons Lizenz, sofern sich aus der Abbildungslegende nichts 
anderes ergibt. Sofern das betreffende Material nicht unter der genannten Creative Commons 
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für die oben aufgeführten Weiterverwendungen des Materials die Einwilligung des jeweiligen 
Rechteinhabers einzuholen. 
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Forschungsmodell und Ableitung der 
Forschungsfragen 


Zentrales Thema dieser Arbeit ist die Wahrnehmung automatisiert generierter Nach- 
richtenberichterstattung durch deutsche Leser:innen in Verbindung mit den Theo- 
rien der Kommunikationswissenschaft zu Vertrauen in Journalismus (vgl. Ziel der 
Arbeit in Abschnitt 1.1). Die forschungsleitenden Fragen lauten: 


Wie nehmen Lesende automatisierten Journalismus in Deutschland im Jahr 2022 
wahr? Welche Bedeutung haben automatisiert generierte Nachrichtentexte für die 
Bewertung des generalisierten Vertrauens in Journalismus? Welche Bedeutung messen 
Lesende den Verfahren bei und welche Einflussfaktoren wirken auf die Vertrauensbe- 
wertung? 


Im Folgenden werden zunächst die bisher im Forschungsstand identifizierten For- 
schungslücken dargestellt. Anschließend erfolgt die Ausarbeitung des konkre- 
ten Forschungsinteresses der vorliegenden Arbeit und abschließend werden die 
Forschungs- und Detailfragen abgeleitet. 


6.1 Zusammenfassung der identifizierten 
Forschungslücken 


In der Beschreibung des Untersuchungsgegenstands, der Darstellung der Ver- 
trauensforschung und der Aufarbeitung des Forschungsstands zur wahrgenomme- 
nen Glaubwürdigkeit computergenerierter Nachrichten wurden bereits Forschungs- 
lücken angesprochen, die im Folgenden zusammengefasst und konkretisiert werden. 
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156 6 Forschungsmodell und Ableitung der Forschungsfragen 


Wahrnehmung des automatisierten Journalismus 
Die Perspektive der Lesenden im automatisierten Journalismus wird im Forschungs- 
stand über die Wahrnehmung und Bewertung computergenerierter Nachrichtentexte 
in standardisierten Online-Experimenten mit anschließender quantitativer Online- 
Befragung erhoben. Die Studien sind im Aufbau vergleichbar und es wird beispiels- 
weise mit direkten Textvergleichen, gekennzeichneten und nicht-gekennzeichneten 
Texten, manipulierten Textquellen und verschiedenen Nachrichtenthemen gearbei- 
tet. Im Mittelpunkt steht die Glaubwürdigkeit computergenerierter Texte, die mit 
unterschiedlichen Skalen zu den Dimensionen Qualität, Lesbarkeit und wahrge- 
nommener Fachkenntnis der Stimuli erhoben wird. Die Ergebnisse zeigen, dass 
maschinengenerierte Texte a) nicht von menschlich verfassten Texten unterscheid- 
bar sind und b) die Unterschiede in der Bewertung beider Textarten im Allgemeinen 
zu gering sind, um statistisch zuverlässige Aussagen zu treffen. Berücksichtigt man 
die geringen Unterschiede, dann gelten c) computergenerierte Stimuli in der Ten- 
denz als glaubwürdiger, objektiver und ihnen wird eine hohe Fachkenntnis zuge- 
schrieben. Die menschlich verfassten Texte hingegen schneiden bei der Lesbarkeit 
und dem Lesevergnügen besser ab. Zudem zeigen d) Leser:innen eine Vorliebe für 
als menschlich verfasst gekennzeichnete Texte, unabhängig davon, ob der Artikel 
tatsächlich von einem Menschen geschrieben wurde. Weitere Einflussfaktoren wie 
e) Vorerfahrung mit Automatisierung, Kenntnisse der Technologie und Nachrich- 
tenkonsum haben teilweise moderierende Wirkung (vgl. Abschnitt 5.3). 

Zur Wahrnehmung des automatisierten Journalismus durch Lesende sind fol- 
gende Punkte nicht ausreichend bearbeitet worden: 


1. Exploration weiterer Einflussfaktoren: Die Studienautor:innen im Forschungs- 
stand gehen davon aus, dass weitere Einflussfaktoren für die Wahrnehmung und 
Bewertung des automatisierten Journalismus relevant sind. Deshalb seien For- 
schungsstudien notwendig, um weitere Merkmale auf ihren Zusammenhang mit 
der Vertrauensbewertung hin zu explorieren und zu prüfen (vgl. z.B. Tandoc Jr. 
et al. 2020: 559; Haim und Graefe 2017: 1055; Wölker und Powell 2018: 12f.; 
Graefe und Bohlken 2020: 58). 

2. Ausweitung der Forschungsperspektive: Mehrere Autor:innen sprechen an, dass 
zusätzlich zu den quantitativen Studien insbesondere eine qualitative Perspektive 
notwendig sei, um die Bewertung der Lesenden und ihren konkreten Umgang mit 
automatisierten Texten sowie mögliche Erwartungen an automatisierten Journa- 
lismus besser nachvollziehen zu können (vgl. z.B. Tandoc Jr. et al. 2020: 559; 
Graefe und Bohlken 2020: 58; Jia 2020: 2625 f.; Haim und Graefe 2017: 1055, 
1057, 2018b: 156). 
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3. Glaubwürdigkeit und Vertrauen: Vertrauen und Glaubwürdigkeit sind sowohl 
theoretisch als auch empirisch eng miteinander verbundene Konzepte. Für eine 
qualitative und stärker reflektierende Perspektive — so wurde in Kapitel 4 argu- 
mentiert — ist dabei der Glaubwürdigkeitsbegriff weniger geeignet, sondern viel- 
mehr der Fokus auf Vertrauen in automatisierten Journalismus notwendig. Ver- 
trauen wird im Forschungsstand bisher nur vereinzelt und, wenn überhaupt, 
im Kontext der Qualitäts- oder Glaubwürdigkeitsforschung als Dimension der 
Glaubwürdigkeit operationalisiert. Es gibt keine Studien, die sich explizit mit 
Vertrauensbewertungen in automatisierten Journalismus beschäftigen. 

Ein ausreichend hohes Vertrauen der Lesenden in automatisierten Journa- 
lismus ist aber zum einen relevant für die mittel- beziehungsweise langfristige 
Akzeptanz der automatisierten Textgenerierung im Journalismus. Wenn in der 
Bevölkerung zudem verstärkt das Wissen um die Existenz der automatisierten 
Berichterstattung thematisiert wird und Lesende davon ausgehen, dass weite 
Teile der Berichterstattung hybrid oder automatisiert erzeugt werden, dann wird 
zum anderen die Frage relevant, ob sich am Vertrauen der Lesenden in Journa- 
lismus insgesamt Veränderungen durch die Existenz des automatisierten Jour- 
nalismus ergeben. 


Vertrauen in journalistische Medien und Journalismus 

Vertrauen in journalistische Medien wird allgemein definiert als „the individual’s 
willingness to be vulnerable to media objects, based on the expectation that they 
will perform a) satisfactorily for the individual and/or b) according to the domi- 
nant norms and values in society (i.e. democratic media functions.) [Herv. i. 
Org.|“(Fawzi, Steindl et al. 2021: 3). Eine Vertrauensbeziehung besteht immer 
aus einem Vertrauensgebenden und mindestens einem Vertrauensobjekt. Im Mit- 
telpunkt der vorliegenden Arbeit steht ein generalisierter Vertrauensbegriff mit 
dem Bezugsobjekt des automatisierten Journalismus beziehungsweise Journalis- 
mus im Allgemeinen, der teilweise mit journalistischer Textautomatisierung arbei- 
tet!. Als wesentliche Einflussfaktoren auf generalisierte Vertrauenszuschreibun- 
gen wurden bisher untersucht: ausgewählte Personenmerkmale, die Informations- 
nutzung der Lesenden, der Einfluss der Erwartung und der Bewertung verschie- 
dener Qualitäts- und Leistungsmerkmale sowie eine Diskrepanz aus Erwartung 
und tatsächlicher Wahrnehmung. Ein relevanter Zusammenhang wurde dabei nur 
für einzelne Qualitäts- und Leistungsmerkmale, das wahrgenommene Vertrau- 
ensklima und Gründe für Qualitätsmängel, die die Lesenden vermuten festgestellt 


! Diese nichttrennscharfe Abgrenzung ergibt sich aus der Tatsache, dass beide Begriffe schon 
theoretisch schwer abgrenzbar sind und in der Empirie vermutlich nicht zwischen beiden 
Objekten unterschieden wird. 
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(vgl. ausführlich Abschnitt 4.4.2). Weitere Einflussfaktoren auf Medienvertrauen 
im Allgemeinen haben Fawzi, Steindl et al. (ebd.) aufgearbeitet und gruppieren 
diese in individuelle und institutionelle Einflussfaktoren, die sich jeweils in soziale, 
politische und medienrelevante Gründe unterteilen lassen. Diese Aufarbeitung kann 
zusätzlich zu den genannten Gründen für generalisiertes Journalismusvertrauen als 
Quelle für die Exploration von Einflussfaktoren auf das Vertrauen in automatisierten 
Journalismus genutzt werden (vgl. Abschnitt 4.4.1). 


1. Einflussfaktoren auf Vertrauen in Medien und Journalismus: Innerhalb der Ver- 
trauensforschung weisen mehrere Autor:innen darauf hin, dass die bisher zusam- 
mengetragenen Sammlungen an Einflussfaktoren für Medien- und Journalimus- 
vertrauen nicht als abgeschlossen betrachtet werden können. Es wird weitere 
Forschung zur Entstehung, zu möglichen Einflüssen und Wechselwirkungen 
von Faktoren auf Vertrauensbewertungen gefordert (vgl. Prochazka 2020: 49). 

2. Mittlere Vertrauensniveaus: Die kommunikationswissenschaftliche Vertrauens- 
forschung hat sich in den vergangenen Jahren im Schwerpunkt mit sinkendem 
oder fehlendem Medienvertrauen beschäftigt. Untersucht wurden beispielsweise 
eine ansteigende Polarisierung des Meinungsspektrums oder die Beweggründe 
für Misstrauensbewertungen durch Medienskeptiker:innen. Dieser Forschungs- 
schwerpunkt spiegelt auch die öffentlich wahrnehmbare Debatte um Fake News 
oder Lügenpresse-Vorwürfe wider. Deutlich weniger Forschungsarbeiten gibt 
es zu Vertrauensbewertungen durch Personen, die mittleres Vertrauen in Jour- 
nalismus im Allgemeinen angeben (Prochazka 2020: 269£.). 

3. Vertrauen und Medieninnovationen: Im Forschungsstand gibt es Studien, die 
sich mit Einflussfaktoren auf generalisiertes Journalismusvertrauen beschäfti- 
gen. Dazu wurden beispielsweise medienspezifische Einflussfaktoren auf die 
Vertrauensbewertung untersucht und erhoben, welche Auswirkungen unter- 
schiedliche Wissensstände der Lesenden zu Medien und Journalismus haben. Es 
gibt einzelne Arbeiten zur Wahrnehmung von Medienwandel durch das Publi- 
kum (vgl. P. Müller 2016) und wenige Studien zum Umgang mit Medienwandel- 
und Medieninnovationsprozessen (vgl. Wolf 2014). Der Vertrauensforschung 
fehlt die fundierte Perspektive, welchen Einfluss der Umgang Lesender mit dem 
Medienwandel auf ihre Vertrauensbewertung des Journalismus als Ganzes hat. 

4. Ausweitung der Forschungsperspektive: Angesprochen wurde bereits, dass Ver- 
trauen als Begriff und theoretisches Konstrukt für den explorativen und quali- 
tativen Zugang der vorliegenden Arbeit gegenüber dem Glaubwürdigkeitsbe- 
griff bevorzugt wird. Mit dieser Schwerpunktsetzung gehen eine Ausweitung 
der Forschungsperspektive und eine Erweiterung des zugrundeliegenden For- 
schungsstands einher: Es gibt eine Reihe zwar unterschiedlicher und teilweise 


6.1 
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überlappender, aber existenter theoretischer und empirischer Studien zur Opera- 
tionalisierung von Vertrauen, zu verschiedenen Vertrauensobjekten und der Art 
der Umsetzung der Vertrauensfrage und zu daraus folgenden Konsequenzen für 
die Erhebung von Vertrauen. Außerdem gibt es eine systematische Aufarbeitung 
von Merkmalen, die in den Vertrauensstudien Zusammenhänge zur Vertrauens- 
bewertung aufzeigen können. Mit dem Wechsel zum Vertrauensbegriff erwei- 
tert sich das theoretische Fundament der vorliegenden Arbeit und es gibt eine 
Reihe möglicher Einflussfaktoren, die in Studien bereits getestet wurden und 
die möglicherweise auch im Zusammenhang mit Vertrauen in automatisierten 
Journalismus relevant sind. 

Vertrauen und automatisierter Journalismus: Es gibt — wie bereits 
angesprochen - bisher keine Forschung, die sich mit Vertrauensbewertungen 
in automatisierten Journalismus oder in Journalismus, der teilweise mit Textau- 
tomatisierungen arbeitet, beschäftigt (vgl. Kunert 2019: 143). 


Kommunikationswissenschaftliche Modellentwicklung 

Die kommunikationswissenschaftliche Vertrauensforschung ist geprägt von unein- 
heitlich verwendeten Begriffen, einer Vielzahl unterschiedlich konzipierter Modelle 
und der überlappenden Operationalisierung der Begriffe mit angrenzenden Konzep- 
ten. Mit Fawzi, Steindl et al. (2021) hat eine Systematisierung und theoretische Fun- 
dierung der Vertrauensforschung stattgefunden, die als nicht abgeschlossen gelten 
kann. Zur Weiterentwicklung der Vertrauensforschung sind folgende Forschungs- 
lücken zu benennen: 


1. 


Medienwandel und Journalismusvertrauen: Es gibt kein Modell der Vertrauens- 
bewertung der Lesenden, das den Umgang des Publikums mit Medienwandel- 
und Medieninnovationsprozessen berücksichtigt. Die bisher verwendeten 
Modelle prüfen beispielsweise keinen Umgang der Teilnehmenden mit digi- 
talen Transformationsprozessen und deren Auswirkung auf die Wahrnehmung 
oder Vertrauensbewertung der Lesenden im Journalismus als Ganzes. 

Stabilität der Vertrauensurteile: Zudem gibt es in der Kommunikationswis- 
senschaft keine Vertrauensmodelle, welche die Entwicklung oder Stabilisie- 
rung individueller Vertrauenszuschreibungen im Zeitverlauf berücksichtigen. 
In Abschnitt 4.2.2 wurde angesprochen, dass zum Beispiel in der Psycholo- 
gie Modelle der Vertrauenskalibrierung im Umgang mit Automatisierungen 
in gesellschaftlich-relevanten Bereichen existieren, die möglicherweise in die 


Kommunikationswissenschaft übertragen werden können”. 


? Für die vorliegende Arbeit ist das Modell der Vertrauenskalibrierung nicht geeignet, da 
es sich beim automatisierten Journalismus nicht um eine Mensch-Maschine-Interaktion im 


160 6 Forschungsmodell und Ableitung der Forschungsfragen 


3. Art der Vertrauensfrage: Im Forschungsstand wurden — neben den Einfluss- 
faktoren auf die Vertrauensbewertung — auch Daten erhoben, die zeigen, dass 
sich das angegebene Vertrauen der Lesenden in Abhängigkeit von der Art der 
Vertrauensfrage ändert (vgl. z.B. Prochazka 2020: 235). Hier sind weitere Stu- 
dien mit unterschiedlichen Erhebungsmethoden notwendig, um die bisherigen 
Ergebnisse zu verifizieren und zu generalisieren (van Dalen 2019: 50 ff.). 


6.2  Forschungsziel und Entwicklung des 
Forschungsmodells 


Leser:innen in Deutschland sind beim Konsum von Zeitungen und Zeitschriften, 
sowohl online als auch offline, regelmäßig mit automatisiert oder hybrid erzeugten 
Inhalten konfrontiert. Da es überwiegend keine einheitliche Kennzeichnung dieser 
Inhalte gibt, ist davon auszugehen, dass automatisiert generierte Inhalte wesent- 
lich häufiger konsumiert werden, als vielen Lesenden bewusst ist. Zudem zeigen 
Experimente zur wahrgenommenen Glaubwürdigkeit computergenerierter Nach- 
richtentexte, dass Lesende nicht eindeutig benennen können, ob Nachrichtentexte 
von Journalist:innen geschrieben oder durch Algorithmen erzeugt wurden. In dieser 
Arbeit wird argumentiert, dass automatisierter Journalismus eine Medieninnova- 
tion ist, die mittel- und langfristig in der Praxis noch weitaus häufiger angewandt 
werden wird und deren Technologien konstante Weiterentwicklung und Verbes- 
serungen erfahren. Automatisierter Journalismus wird beschrieben als relevante 
Medieninnovation mit der Besonderheit, dass Algorithmen — im Rahmen der pro- 
grammierten Softwaresysteme — teilweise Entscheidungen autonom treffen können. 
Außerdem wird angenommen, dass die wahrgenommene Komplexität der journalis- 
tischen Nachrichtenproduktion durch automatisierte Berichterstattung erhöht wird 
und die Entstehung von Nachrichten für das Publikum komplexer und weniger gut 
nachvollziehbar erscheint. Die Grundannahme dieser Arbeit lautet zusammenfas- 
send, dass Lesende regelmäßig mit automatisiert erzeugten Inhalten konfrontiert 
sind, generell wenig über automatisierten Journalismus wissen beziehungsweise 
keine Kenntnis über diese Art der Nachrichtenproduktion haben und Hintergründe 
zur Technologie weitestgehend unbekannt sind. Zudem wird Nachvollziehbarkeit 
der journalistischen Nachrichtenproduktion für Lesende erschwert und mittel- und 
langfristig wird gesellschaftlich breiter als bisher diskutiert werden müssen, welche 


klassischen Sinn handelt. Vielmehr haben die Lesenden Kontakt mit dem Output einer 
Mensch-Maschine-Interaktion durch Journalist:innen. Das Vertrauenskalibrierungsmodell 
soll als Beispiel dienen, wie Modelle der Mensch-Maschine-Interaktion zu Erkenntnisgewinn 
auch in der Kommunikationswissenschaft führen können. 
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Entscheidungen Algorithmen im Journalismus autonom treffen können und wo sie 
Beschränkungen unterliegen sollten. 

Gegenstand dieser Untersuchung ist der automatisierte Journalismus und seine 
Wahrnehmung durch Lesende mit Schwerpunkt auf ihre Vertrauensbewertung. 
Angesprochen wird ein generalisierter Vertrauensbegriff, der sich auf automatisier- 
ten Journalismus bezieht beziehungsweise generell Journalismus anspricht, der mit 
automatisierter Textgenerierung arbeitet. Rekrutiert werden Lesende aus Deutsch- 
land mit unterschiedlichen Voraussetzungen hinsichtlich ihres Vorwissens zum auto- 
matisierten Journalismus, dem Konsum von Nachrichten, sowie unterschiedlichen 
Niveaus hinsichtlich Technologieaffinität und Medienkompetenz’. 

In den Ausführungen zu den Forschungsdefiziten angesprochen wurde a) die 
fehlende Kontextualisierung von Vertrauen in automatisierten Journalismus und 
die stark quantitativ dominierte Perspektive auf die wahrgenommene Glaubwürdig- 
keit automatisiert generierter Texte. Außerdem fehlen in der Vertrauensforschung 
b) zusätzliche Studien zur Ermittlung von Einflussfaktoren auf das Vertrauen der 
Lesenden in journalistische Medien sowie die weitere Berücksichtigung von Perso- 
nen mit mittleren Vertrauensniveaus. Zudem gibt es c) Forschungsbedarf zur Ein- 
bindung der Rezeption von Medienwandel- und Medieninnovationsprozesse auf 
die Vertrauensurteile von Journalismus als Ganzes und die Thematisierung von 
sich verändernden oder stabilisierenden Vertrauensurteilen. Weiterhin wurden unter- 
schiedliche Ergebnisse im angegebenen Journalismusvertrauen in Abhängigkeit von 
der Art der Forschungsfrage gemessen und weitere Forschung zur Verifikation der 
bisherigen Erkenntnisse angeregt. Die vorliegende Arbeit nimmt — aufbauend auf 
den identifizierten Forschungslücken und den angeführten Grundannahmen - eine 
qualitative Perspektive auf die Wahrnehmung und Vertrauensbewertung des auto- 
matisierten Journalismus ein. Dazu sollen die bisher durchgeführten quantitativen 
Studien zur Glaubwürdigkeitsbewertung automatisiert generierter Texte um eine 
qualitative und stärker reflektierende Perspektive der Lesenden erweitert und ver- 
tieft werden. Außerdem soll die Urteilsbildung durch eine intensive Reflexion des 
Vertrauens in automatisierten Journalismus nachvollzogen werden, wenngleich die 
Arbeit durch das Querschnittsdesign nur einen Ausschnitt der Vertrauensentwick- 
lung der Lesenden leisten kann. Weiterhin werden ausgewählte Merkmale des Unter- 
suchungsgegenstands im Zusammenhang mit einem möglichen Einfluss auf die Ver- 
trauensbewertung thematisiert. Diese ergeben sich aus dem bisherigen Forschungs- 
stand zur Wahrnehmung computergenerierter Texte beziehungsweise aus Studien zu 


3 Die Auswahl der Teilnehmenden und die Zusammensetzung der Focus Groups wird aus- 
führlich in Abschnitt 7.3 dargestellt. 
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Vertrauen in journalistische Medien und Vertrauen in Journalismus im Allgemeinen. 
Zusätzlich sollen mögliche weitere Einflussfaktoren erforscht werden. 

Die Komplexität der Vertrauensforschung ist in dieser Arbeit bereits mehrfach 
angesprochen worden. Ausgeführt wurde beispielsweise, dass Einflussfaktoren auf 
die Vertrauensbewertung in journalistische Medien durch Lesende häufig nicht 
durch ein Merkmal bestimmt, sondern jeweils mehrere Faktoren zusammen und in 
Wechselwirkung untersucht werden müssen. Die vorliegende Arbeit ist eine Quer- 
schnittstudie und kann weder Kausalbeziehungen zwischen Einflussfaktoren und 
der Vertrauensbewertung der Lesenden nachweisen, noch kann sie die Entwicklung 
von Vertrauen in automatisierten Journalismus und eine mögliche Stabilisierung der 
Urteile im Zeitverlauf nachvollziehen. Aufgrund der geringen Zahl der Teilnehmen- 
den kann zudem keine grundsätzliche Verallgemeinerbarkeit oder Repräsentativität 
der Ergebnisse angenommen werden. Im Mittelpunkt der vorliegenden Arbeit ste- 
hen vielmehr die Exploration von Vertrauenszuschreibungen im Journalismus sowie 
die intensive Bearbeitung möglicher Einflussfaktoren. 

Das Forschungsmodell wurde entwickelt, um die Forschungslücken zu definieren 
und im Detail herausarbeiten zu können. Zudem kann die vorliegende Arbeit und 
ihre Studienergebnisse als Grundlage für Anschlussforschung genutzt werden (vgl. 
Abschnitt 9.2). Die Ziele der vorliegenden Arbeit sind zudem im Schaubild 6.1 
schematisch dargestellt. 

Im folgenden Abschnitt wird das Ziel der Arbeit konkretisiert, indem aus dem 
Forschungsstand und den identifizierten Forschungslücken die Forschungs- und 
Detailfragen abgeleitet werden. Zur Beantwortung der Forschungsfragen werden 
leitfadengestützte Online-Focus Groups durchgeführt. Aufgrund der Besonder- 
heiten des Untersuchungsgegenstands und des sehr unterschiedlichen Vorwissens 
der Teilnehmenden zum automatisierten Journalismus werden drei unterschiedli- 
che Focus Groups zusammengestellt. Es wird zum einen eine möglichst hetero- 
gene Gruppe an Teilnehmenden rekrutiert, die unterschiedliches Vorwissen zum 
automatisierten Journalismus, eine durchschnittlich ausgeprägte Technologieaffi- 
nität vorweisen und unterschiedlich oft Nachrichten konsumieren. Weiterhin wird 
eine Focus Group mit Personen zusammengestellt, die eine überdurchschnittlich 
hohe Technologieaffinität angeben sowie eine dritte Focus Group aus Personen mit 
hoher Medienkompetenz rekrutiert. Im Sampling werden zusätzlich demografische 
Merkmale, der kulturelle Hintergrund, das allgemeine Journalismusvertrauen sowie 
ein vorhandener journalistischer Hintergrund kontrolliert erfragt und außerdem die 
Informationsnutzung, Technologieaufgeschlossenheit und das Vorwissen zum auto- 
matisierten Journalismus erhoben (vgl. ausführlich Abschnitt 7.3). 
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Abbildung 6.1 Forschungsmodell zu Einflussfaktoren der Vertrauensbewertung im auto- 
matisierten Journalismus. (Eigene Darstellung) 


6.3 Ableitung der Forschungs- und Detailfragen 


Basierend auf den identifizierten Forschungslücken und dem beschriebenen Erkennt- 
nisinteresse, befasst sich die Arbeit mit drei Fragekomplexen, die im Folgenden mit 
Forschungs- und Detailfragen weiter spezifiziert werden. 


6.3.1 Fragenkomplex 1:Wahrnehmung des automatisierten 
Journalismus und seine Bedeutung für Lesende 


Fragenkomplex 1 befasst sich mit der Wahrnehmung des automatisierten Journalis- 
mus durch die Lesenden. Dazu soll erhoben werden, wie Lesende automatisierten 
Journalismus beschreiben und welche Vorstellung sie vom Untersuchungsgegen- 
stand haben. Weiterhin soll erfragt werden, wie Lesende Vertrauen in automati- 
sierten Journalismus beschreiben, wie sie eine mögliche Vertrauenszuschreibung 
begründen und an welchen Punkten sie diese konkret festmachen können. Zudem 
soll die Bedeutung erfasst werden, die Lesende der Medieninnovation für den Jour- 
nalismus als Ganzes zuschreiben. Abschließend soll thematisiert werden, welche 
Auswirkungen die Kenntnis der Lesenden über die Existenz und den Einsatz der 


164 6 Forschungsmodell und Ableitung der Forschungsfragen 


automatisierten journalistischen Berichterstattung im deutschen Journalismus auf 
ihre Vertrauenszuschreibung in Journalismus als Ganzes hat. Die konkreten For- 
schungsfragen lauten: 


FF1.1 Vorstellung: Welche Vorstellung haben Lesende vom automatisierten Jour- 
nalismus und wie nehmen sie konkrete Praxisbeispiele wahr? 

FF1.2 Beschreibung und Bewertung: Wie beschreiben und bewerten Lesende 
automatisierten Journalismus? 

FF1.3 Vertrauen in automatisierten Journalismus: Wie beschreiben Lesende 
Vertrauen in automatisierten Journalismus und woran machen sie dieses 
fest? 

FF1.4 Allgemeines Vertrauensklima: Welches wahrgenommene Vertrauen- 
sklima* beschreiben die Lesenden gegenüber automatisiertem Journalis- 
mus? 

FF1.5 Kenntnis der Existenz: Welchen Einfluss hat die Automatisierung bezie- 
hungsweise die Kenntnis über die Existenz von automatisiertem Journalis- 
mus auf das generalisierte Vertrauen von Rezipient:innen in Journalismus? 


6.3.2 Fragenkomplex 2: Erwartung zum Einsatz der 
Technologie im Journalismus 


Fragenkomplex 2 untersucht die Erwartungen der Lesenden an automatisierten Jour- 
nalismus. Im Mittelpunkt stehen Erwartungen an den Einsatz der automatisierten 
Textgenerierung im Journalismus und Erwartungen an vertrauensbildende Maßnah- 
men, die Medienverantwortliche umsetzen. Dazu zählen beispielsweise die Kenn- 
zeichnung computergenerierter Nachrichten oder die Aufklärung über den Einsatz 
der Technologie. Außerdem soll die Erfüllung beziehungsweise Nicht-Erfüllung 
der Erwartungen an vertrauensbildende Maßnahmen thematisiert werden. 

Die kommunikationswissenschaftliche Vertrauensforschung hat den Einfluss der 
Erwartungen an Qualitäts- und Leistungsmerkmale sowie einen Einfluss der Diskre- 
panz zwischen den Erwartungen und tatsächlichen Bewertungen der Lesenden auf 
journalistische Medien behandelt. Auch die Studien zur bewerteten Glaubwürdig- 
keit automatisiert generierter Nachrichtentexte arbeiten teilweise mit den Erwartun- 
gen und der Wahrnehmung computergenerierter Texte durch Lesende. Dazu werden 


4 Mit dem wahrgenommenen Vertrauensklima wird beschrieben, wie Teilnehmende das Ver- 
trauen der Bevölkerung insgesamt in automatisierten Journalismus beschreiben. Prochazka 
(2020) schreibt der Vertrauensklimawahrnehmung eine hohe Bedeutung für das Vertrauen der 
Lesenden bei (vgl. ebd.: 212 ff.). 
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die Erwartungen der Teilnehmenden vor der Vorlage konkreter Stimulitexte erhoben 
und anschließend ihre Erfüllung abgefragt. Ein solches Vorgehen ist im Rahmen der 
vorliegenden Arbeit weder möglich noch zielführend, da zum einen davon auszu- 
gehen ist, dass wenige Teilnehmende einen konkreten Eindruck von automatisiert 
generierten Texten haben und zum anderen weniger die Erwartung an konkrete Text- 
stimuli sondern vielmehr ein generalisiertes Vertrauensobjekt angesprochen werden 
soll. Aufgrund der Kombination aus wenig Vorwissen und einem abstrakten Vertrau- 
ensbegriff werden die Erwartungen in den Focus Groups an unterschiedlichen Stel- 
len immer wieder thematisiert und zwar auch - aber nicht nur-in Verbindung mit der 
Vorlage konkreter Texte abgefragt. Es soll insgesamt weniger um Erwartungen der 
Lesenden an Qualitäts- und Leistungsmerkmale der automatisiert generierten Texte 
gehen. Im Mittelpunkt stehen Erwartungen an die Umsetzung vertrauensbildender 
Maßnahmen durch Medienorganisationen beim Einsatz des automatisierten Journa- 
lismus sowie Erwartungen, die sich an etablierten Mainstream-Medien orientieren 
und auch ohne konkreten Bezug zu einzelnen Publikationen oder Stimulitexten im 
Zusammenhang mit dem Untersuchungsgegenstand formuliert werden. 

Die Erfassung der Erwartungen der Lesenden an den Einsatz der automatisierten 
Berichterstattung im Journalismus und die wahrgenommene Erfüllung der vertrau- 
ensbildenden Maßnahmen wird in den folgenden Forschungsfragen zusammenge- 
fasst: 


FF2.1 Erwartungen: Welche Erwartungen haben die Rezipient:innen an vertrau- 
ensbildende Maßnahmen der Medienorganisationen, die automatisierten 
Journalismus einsetzen? 

FF2.2 Erwartungserfüllung: Wie nehmen sie die Erfüllung der vertrauensbilden- 
den Maßnahmen wahr? 


6.3.3 Fragenkomplex 3: Spezifische Einflussfaktoren auf die 
Vertrauenszuschreibung in automatisierten 
Journalismus 


Fragenkomplex 3 thematisiert eine Reihe von Einflussfaktoren, die in Zusammen- 
hang mit der Vertrauensbewertung der Lesenden in automatisierten Journalismus 
stehen könnten. Dazu werden a) ausgewählte Personenmerkmale der Lesenden, b) 
Eigenschaften des automatisierten Journalismus, c) Publikations- und Textmerk- 
male automatisiert generierter Texte besprochen, sowie d) gezielt nach möglichen 
weiteren Einflussfaktoren gefragt. 
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Zunächst werden a) in einigen wenigen Arbeiten zur Wahrnehmung computer- 
generierter Nachrichtentexte die Technologieaufgeschlossenheit und das Vorwis- 
sen der Lesenden zu Automatisierungsvorgängen als moderierende Variable auf 
die Wahrnehmung der Lesenden geprüft (vgl. Waddell 2018; Jia 2020). Außer- 
dem erhebt eine Arbeit den Einfluss der Rezeption von Roboterdarstellungen in 
den Medien auf die bewertete Glaubwürdigkeit der Stimulitexte (vgl. Waddell 
2018). Diese beiden Merkmale werden für die vorliegende Arbeit aufgenommen und 
erweitert: Das Persönlichkeitsmerkmal ‚Technologieaufgeschlossenheit‘ sowie die 
Rezeption von Mediendarstellungen von Robotern oder Künstlichen Intelligenzen 
werden als mögliche Einflussfaktoren auf die Vertrauensbewertung des automati- 
sierten Journalismus berücksichtigt”. 

Weiterhin werden b) aus den Ausführungen zum Untersuchungsgegenstand (vgl. 
Kapitel 3) Besonderheiten des automatisierten Journalismus identifiziert, die eine 
Veränderung, Neuerung oder Innovation im Journalismus darstellen. Angesprochen 
werden fehlende Regelungen oder Selbstverpflichtungen im deutschen Journalis- 
mus hinsichtlich einer Markierung oder Kennzeichnung automatisiert oder hybrid 
generierter Texte sowie insgesamt fehlendes individuelles und gesellschaftliches 
Wissen über automatisierten Journalismus. Die vorliegende Arbeit nimmt zudem 
an, dass mit automatisierter Berichterstattung die Nachvollziehbarkeit des journa- 
listischen Produktionsprozesses für das Publikum deutlich schwieriger wird: Mit 
automatisiertem Journalismus steigen die Anforderungen an Medienkompetenz der 
Lesenden und die Entstehung von Nachrichten wird komplexer. Diese Annahme 
wird unter dem Stichwort ‚steigender Blackboxism‘ thematisiert und ein möglicher 
Einfluss auf die Vertrauensbewertung des automatisierten Journalismus soll in der 
Empirie diskutiert werden. 

Zusätzlich werden c) Publikations- und Textmerkmale untersucht, die im Zusam- 
menhang mit der Wahrnehmung des automatisierten Journalismus stehen können. 
Diese Merkmale werden aus der Aufarbeitung der Studien zur wahrgenomme- 
nen Glaubwürdigkeit automatisiert generierter Nachrichten extrahiert (vgl. Kapi- 
tel 5) und auf ein generalisiertes Vertrauensobjekt übertragen. Im Forschungsstand 
als teilweise relevant für die wahrgenommene Glaubwürdigkeit werden erhoben: 
die Kennzeichnung und die Angabe des Textursprungs automatisiert oder hybrid 
generierter Nachrichtentexte, die journalistische Stil- und Darstellungsform mit der 
wesentlichen Unterscheidung in informierende und kommentierende journalistische 
Texten, das Nachrichtenthema sowie der Einfluss der — als vertrauenswürdig oder 


5 Eine Focus Group arbeitet mit Personen mit hoher Medienkompetenz. Diese gezielte Rekru- 
tierung dient dem gemeinsamen Erzählgegenstand der Teilnehmenden und soll für einen 
lockeren und möglichst guten Austausch in der Gruppe sorgen. Ansonsten wird Medienkom- 
petenz im Rahmen dieser Arbeit nicht als Einflussfaktor berücksichtigt. 
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nicht-vertrauenswürdig wahrgenommenen - Publikation, in der der jeweilige Text 
erschienen ist. In der vorliegenden Arbeit werden diese Merkmale im Zusammen- 
hang mit der wahrgenommenen Vertrauenswürdigkeit des automatisierten Journalis- 
mus erörtert. Die vorliegende Arbeit hat, wie mehrfach angesprochen, explorativen 
Charakter und deshalb liegt d) ein Schwerpunkt auf der Suche nach zusätzlichen, 
im Forschungsstand bisher nicht berücksichtigten Einflussfaktoren auf die Wahr- 
nehmung des Untersuchungsgegenstands. 

Der Einfluss ausgewählter Personenmerkmale, Eigenschaften des Unter- 
suchungsgegenstands, Publikations- und Textmerkmale sowie mögliche weitere 
Einflussfaktoren im Fragenkomplex Drei werden in folgenden Forschungs- und 
Detailfragen konkretisiert: 


FF3.1 Personenmerkmale: Welchen Einfluss haben das Persönlichkeitsmerkmal 
‚Technologieaufgeschlossenheit‘ und die Medienrezeption von Roboterdar- 
stellungen auf die Vertrauensbewertung des automatisierten Journalismus? 

FF3.2 Eigenschaften des Untersuchungsgegenstands: Wie hängen ausgewählte 
Besonderheiten (fehlende Kennzeichnungsregelungen, geringes Wissen 
über Untersuchungsgegenstand, steigender Blackboxism) des automatisier- 
ten Journalismus — beziehungsweise Veränderungen im Journalismus durch 
automatisierte Textgenerierung — mit Vertrauen in Journalismus zusammen? 

FF3.3 Publikations- und Textmerkmale: Welchen Einfluss haben die Kennzeich- 
nung, das Nachrichtenthema, die journalistische Stil- und Darstellungsform 
sowie die Publikation auf die Vertrauensbewertung des automatisierten Jour- 
nalismus? 

FF3.4 Exploration: Gibt es weitere Faktoren der Vertrauensbewertung, die bis- 
her nicht berücksichtigt wurden und die den automatisierten Journalismus 
betreffen? 
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Methodik und Untersuchungsdesign: Focus 7 
Groups 


Wie in Kapitel 6 dargestellt und hergeleitet, hat die vorliegende Arbeit im empiri- 
schen Teil das wesentliche Anliegen, die Bedeutung von Vertrauen in automatisier- 
ten Journalismus für Lesende abzubilden und die Auswirkungen der Spezifikation 
der automatisierten Berichterstattung auf die Vertrauensbewertung herauszuarbei- 
ten. Zur Beantwortung der forschungsleitenden Fragestellung werden leitfadenge- 
stützte Focus Groups als Instrument zur Datenerhebung ausgewählt und die Methode 
an einigen Stellen individuell für das Forschungsinteresse angepasst. Durchgeführt 
werden drei Gruppengespräche mit jeweils unterschiedlichen Zielsetzungen. Im fol- 
genden Kapitel wird die Methodenwahl begründet und das Vorgehen dokumentiert. 
Weitere Dokumente zur intersubjektiven Überprüfbarkeit des Vorgehens sind im 
Appendix veröffentlicht; an gegebener Stelle wird darauf verwiesen. 


7.1 Darstellung der Methode und Begründung der 
Methodenwahl 


Focus Groups gehören zu den Gruppenbefragungen der qualitativen empirischen 
Sozialwissenschaft und sind als strukturierte, moderierte Gruppengespräche zu 
einem inhaltlichen Schwerpunkt konzipiert. Sie eignen sich vor allem zur Explora- 
tion von Forschungsthemen (vgl. Lüthje 2016: 158 f.) und werden häufig in Vorstu- 
dien oder in Kombination mit anderen Methoden eingesetzt, können aber auch als 
alleinige Methode verwendet werden (vgl. Lamnek und Krell 2016: 443 f.; Kühn 
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und Koschel 2018: 53). Ursprünglich wurden Focus Groups in der Kommunikati- 
onswissenschaft seit den 1940er Jahren vor allem in den USA und Großbritannien 
eingesetzt. Häufiger als in der deutschsprachigen Kommunikationswissenschaft 
werden Focus Groups auch heute im angelsächsischen Raum und insbesondere 
in der Rezeptionsforschung verwendet, zudem findet die Methode Anwendung in 
der (kommerziellen) Marktforschung. Die breit gefächerte Anwendung und lange 
Forschungstradition! hat eine Reihe begrifflicher Ungenauigkeiten und Schwierig- 
keiten in der einheitlichen und nachvollziehbaren Differenzierung zwischen Focus 
Groups, Gruppeninterviews, Gruppendiskussionen und Gruppenbefragungen zur 
Folge”. Die folgende Dokumentation der empirischen Studie dieser Arbeit orien- 
tiert sich an der Begriffsverwendung wie sie beispielsweise Corinna Lüthje (2016) 
vorgenommen hat und die kurz beschrieben werden soll. 

Focus Groups — teilweise auch Gruppeninterviews genannt — gehören zu den 
Methoden der Gruppendiskussion oder Gruppenbefragung. Gruppendiskussionen 
und Gruppenbefragungen sind gleichbedeutend und fassen Forschungsmethoden 
zusammen, „bei denen mehrere Personen gleichzeitig befragt werden“ (ebd.: 157). 
Innerhalb der Gruppendiskussionen werden Forschungsmethoden hinsichtlich 
Erkenntnisinteresse, Standardisierung, Moderationsstil, Untersuchungseinheiten, 
Gruppenzusammensetzung und Gruppengröße sowie dem Setting unterschieden, 
wobei in der Praxis stets auch Mischformen mit Elementen anderer Erhebungsme- 
thoden, beispielsweise von Experimenten, angewendet werden (vgl. ebd.: 158£.). 
Die beiden häufigsten Unterformen der Gruppendiskussionen sind Focus Groups 
sowie offene Gruppendiskussionen in der dokumentarischen Methode. Focus Groups 
folgen einem standardisierten und strukturierten Vorgehen, die Moderation über- 
nimmt einen aktiven und steuernden Part, die Gruppen sind in der Regel deutlich 
größer und homogener als offene Gruppendiskussionen und es gibt einen relativ 


! Focus Groups gehen auf die Arbeiten von Robert K. Merton und Paul Lazarsfeld zurück, 
die in den 1940er Jahren mit Gruppeninterviews die Medienwirkung von Propaganda unter- 
sucht haben (vgl. Lüthje 2016: 159). In den Folgejahren wird die Methode theoretisch und 
methodologisch weiterentwickelt und auch in Deutschland gewinnbringend angewandt (vgl. 
Schäfer 2017: 348; Lamnek und Krell 2016: 385). Eine wesentliche Veränderung der Grup- 
pendiskussion ist die Ausdifferenzierung der offenen Diskussion in der dokumentarischen 
Methode, die Ralf Bohnsack Ende der 1980er Jahre initiiert hat (vgl. Schäfer 2017: 347 f.). 
Aktuelle kommunikations- und medienwissenschaftliche Publikationen, bei denen Daten mit- 
tels Gruppendiskussionen allgemein und im Speziellen durch Focus Groups erhoben werden, 
führen unter anderem Lüthje (2016: 161 f., 170£.), die Beiträge bei Schulz et al. (2012) sowie 
Kühn und Koschel (2018: 8-15) auf. 

? Eine überzeugende Ausarbeitung der Unterschiede zwischen Gruppendiskussionen und 


quantitativen Experimenten sowie die Abgrenzung zu Einzelbefragungen leisten Lamnek 
und Krell (2016: 392-397). 
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engen Leitfaden, der sich stark am Erkenntnisinteresse orientiert. Offene Grup- 
pendiskussionen sind im Gegensatz dazu wenig standardisiert und die Rolle der 
Moderation ist eher passiv und zurückhaltend, die Gruppe soll möglichst natürlich 
sprechen und sich selbst organisieren (vgl. Schäfer 2017: 353£.). Lüthje (2016) 
vergleicht Focus Groups mit leitfadengestützten Interviews und offene Gruppen- 
diskussionen mit narrativen Interviews (vgl. ebd.: 159). In der vorliegenden Arbeit 
werden Focus Groups verwendet. 

Focus Groups haben das Individuum in der Gruppe, weniger eine Gruppendy- 
namik oder die Ausbildung einer Gruppenhierachie im Blick. Der Schwerpunkt 
der Methode liegt zwar auf den Aussagen Einzelner, die Gruppensituation ist den- 
noch wichtig als „stimulierende[r] und integrierende[r] Rahmen zur Generierung 
von Informationen“ (ebd.: 160). Bei Focus Groups soll es sich eben nicht um, „le- 
diglich [...] zeitökonomische Varianten der Einzelbefragung“ (Schäfer 2017: 347) 
handeln, im Gegenteil müssen bei Meinungs- und Einstellungsfragen mögliche Ver- 
zerrungen durch Gruppeneffekte berücksichtigt werden (vgl. Brosius et al. 2016: 
107£.). Focus Groups sind sinnvoll eingesetzt, wenn das Gruppensetting berück- 
sichtigt wird und durch die soziale Interaktion in der Gruppe die Hemmungen der 
Teilnehmenden gelöst und „vergessene Details aktiviert“ (Lüthje 2016: 160) wer- 
den. Dann fördert das Gespräch zwischen den Teilnehmenden die „Generierung 
von Meinungen“ (Brosius et al. 2016: 107f.), auch wenn diese wegen der geringen 
Zahl der Teilnehmenden in der Regel nicht generalisierbar sind. Aber so können, so 
die Autoren weiter, auch „abseitige [Meinungen], stimuliert und formuliert“ (ebd.: 
107 f.) werden. Ein wesentlicher Vorteil von Focus Groups ist also die „größere Tie- 
fenwirkung der Gruppendiskussion im Gegensatz zu anderen Verfahren“ (Lamnek 
und Krell 2016: 441). 

Focus Groups haben offene, lockere und aktivierende Gesprächssituationen zum 
Ziel, in denen das Thema der Studie im Mittelpunkt steht. Dafür ist zum einen die 
Zusammensetzung der Gruppe und zum anderen die Ausgestaltung der Moderati- 
onsrolle und des Leitfadens wichtig. In der Regel kommen Kleingruppen mit zehn 
bis zwölf Personen pro Focus Group zusammen, wobei sich die Teilnehmenden 
nicht zwingend vorab kennen müssen. Ein gemeinsamer Erzählgegenstand oder eine 
gewisse Homogenität der Gruppe, beispielsweise hinsichtlich Alter, Herkunft oder 
Beruf, ist aber förderlich für ein anregendes und lockeres Gespräch (vgl. Schulz et al. 
2012: 207). Die Gesprächsleitung obliegt der Moderation, diese soll aktiv und steu- 
ernd eingreifen, wenn das Gespräch zu sehr vom Erkenntnisinteresse abweicht und 
die Gruppe zum Thema zurückführen. Wenn Proband:innen zu passiv sind, kann der 
oder die Moderator:in gezielt Einzelne ansprechend. Außerdem soll die Gesprächs- 
leitung nachfragen, wenn Unklarheiten bestehen, relevante Themen angesprochen 
werden, die im Leitfaden nicht bedacht wurden, oder nachhaken, wenn vertiefende 
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Aussagen der Teilnehmenden relevant erscheinen. Der vorbereitete Leitfaden ist 
die Grundlage, an der sich die Moderation orientiert. Dieser wird, wie bei leitfa- 
dengestützten Interviews auch, aus den theoretischen Vorüberlegungen der Studie 
abgeleitet. Meist sind die Leitfäden der Focus Groups in mehrere Blöcke gegliedert. 
Sie starten mit einer aktivierenden allgemeinen Einstiegsfrage oder einem Stimu- 
lus, es folgt die Hinführung zum Thema und der Hauptteil mit den Leitfragen. Den 
Abschluss bildet die Abrundung des Gesprächs und die Verabschiedung durch die 
Moderation. Focus Groups werden in der Regel schriftlich protokolliert und die 
Dokumentation häufig durch Video- oder Tonaufzeichnungen unterstützt (vgl. z.B. 
Helfferich 2011: 178-189; Kühn und Koschel 2018: 125-128). 

Die Grenzen von Focus Groups liegen in der Generalisierbarkeit der Ergebnisse 
(vgl. Brosius et al. 2016: 107). Gruppeninterviews sind weiterhin nicht geeignet, 
wenn die Verteilung von Einstellungen innerhalb einer Gruppe ermittelt werden 
sollen oder wenn Individuen in Längsschnittstudien über einen längeren Zeitraum 
hin befragt werden. Einzelinterviews sind außerdem vorzuziehen, wenn „biogra- 
phische Auswahl- und Entscheidungsprozesse oder der Umgang mit identitätsbe- 
zogenen Ambivalenzen [rekonstruiert]“ (Kühn und Koschel 2018: 301 f.) werden 
sollen. Insgesamt ist noch festzuhalten, dass Focus Groups seltener Gegenstand 
der Methodenevaluation und Weiterentwicklung der Kommunikationswissenschaft 
sind. So gibt es vergleichsweise wenig Auseinandersetzung um Gütekriterien der 
Methode, die über die Gruppenzusammensetzung, Aufgaben der Moderation sowie 
eine transparente Dokumentation der Vorbereitung, Durchführung und Auswertung 
des Forschungsprojekts hinausgehen (vgl. z. B. Schulz et al. 2012: 19; Kühn und 
Koschel 2018: 18 f.). Kühn und Koschel (2018) sprechen außerdem die „verführeri- 
sche Wirkung“ (ebd.: 18) von Focus Groups an, die sich aus einer „vermeintlichen 
Einfachheit der Methode“ (ebd.: 18) ergibt, wenn Focus Groups lediglich als zeit- 
sparende Variante von Einzelgesprächen eingesetzt werden (vgl. auch Schäfer 2017: 
347). 


Methodenwahl 

Für das vorliegende Forschungsinteresse werden Focus Groups zur Datenerhebung 
gewählt, weil es um die Exploration eines neuen Forschungsthemas geht, der bishe- 
rige Forschungsstand um eine intensivere Auseinandersetzung mit dem Vertrauen in 
automatisierte generierte Nachrichten ergänzt werden soll und Menschen mit sehr 
unterschiedlichem Vorwissen zum automatisierten Journalismus befragt werden 
(vgl. Kapitel 6). Aus forschungsökomischen Gründen? werden die Focus Groups 


3 Im Wesentlichen betrifft dies die Rekrutierung, die Realisierung, die Aufzeichnung und die 
Auswertung der Focus Groups. 
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online und mit fünf bis sechs Teilnehmenden durchgeführt, wodurch eine Erleich- 
terung der Rekrutierung der Teilnehmenden und der Aufzeichnung der Gespräche 
erzielt wird, wenngleich dadurch Einschränkungen in der Aktivierung der Teil- 
nehmenden sowie in der Zugänglichkeit für nicht-technikaffine Proband:innen hin- 
genommen und in der Auswertung berücksichtigt werden müssen. Die erhöhten 
Anforderungen an die Rolle der Moderation bei Focus Groups sowie durch das 
Online-Verfahren werden bei der Methodenwahl berücksichtigt*. 

Focus Groups sind für explorative Settings gut geeignet, wenngleich sie die 
bereits angesprochene Limitation der Verallgemeinerbarkeit der Ergebnisse mit sich 
bringen (vgl. Abschnitt 9.2). Das qualitative Verfahren verspricht eine intensive 
Auseinandersetzung mit der Wahrnehmung der Lesenden. Ausschlaggebend für die 
Methodenwahl sind weiterhin insbesondere die beschriebenen Vorteile der Focus 
Groups durch das Gruppensetting und die Möglichkeit, Menschen mit unterschied- 
lichem Vorwissen zielführend zum automatisierten Journalismus zu befragen. 

Das Gespräch in der Gruppe ist geeignet, um reflektierte Meinungsbeiträge auch 
von Menschen zu gewinnen, die bisher wenig oder keine Kenntnis des automatisier- 
ten Journalismus haben oder Personen, die sich bisher nicht oder wenig mit automa- 
tisierter Berichterstattung auseinandergesetzt haben. Diese werden im Interview mit 
unterschiedlichen Perspektiven auf die Automatisierung und verschiedenen Argu- 
menten zu deren Auswirkungen konfrontiert und finden Anregung für die indivi- 
duelle Meinungsbildung. Auch wenn eine vertiefte Reflexion nicht unmittelbarer 
Gegenstand des Forschungsinteresses ist, sondern in Folgestudien bearbeitet wer- 
den muss (vgl. 9.2), können durch die Einbeziehung von Menschen ohne Vorkennt- 
nisse erste Meinungsbildungsprozesse erfasst und nachvollziehbar gemacht werden. 
Allerdings profitieren nicht nur Teilnehmende ohne Vorkenntnisse vom Austausch 
in der Gruppe, auch Menschen mit schon gemachten Erfahrungen und Hintergrund- 
wissen zu automatisierten Nachrichten zeigen in einem lebendigen, offenen und 
vielseitigen Gespräch in der Gruppe mehr Interaktion und damit eine intensivere 
individuelle Reflexion, die durch eine Überprüfung ihrer bisherigen Urteile, einen 
multiperspektivischen Austausch sowie ein Sich-Aufeinander-Beziehen entsteht. 
Insgesamt wird durch die soziale Interaktion der Teilnehmenden und durch die 
aktive Förderung einer anregenden und offenen Gesprächssituation eine Tiefenwir- 
kung (vgl. Lamnek und Krell 2016: 441) in der Meinungsreflexion aller Teilneh- 


4 Berücksichtigt wird, dass die Moderatorin — gleichzeitig die Verfasserin dieser Arbeit - in 
Gesprächsführung, aktivierenden Methoden in Gruppensituationen sowie in verschiedenen 
Moderationstechniken geschult ist und Erfahrung in der Moderation von Online- und Offline- 
Gesprächsrunden hat. Außerdem wird Wert auf einen Pretest mit einer herausfordernden 
Gruppensituation gelegt. 
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menden erzeugt. Dadurch können in den Gruppen auch vergessene Details aktiviert 
und abweichende Meinungen thematisiert werden. 

Die Gruppensituation kann aber auch eine Schwäche der Erhebungsmethode ver- 
stärken: Menschen mit niedrigerem Wissensstand oder wenig Erfahrungen sowie 
generell sehr zurückhaltende Menschen können leicht zu stillen Teilnehmenden wer- 
den, beispielsweise aus Einschüchterung durch dominante Viel-Wissende und Mei- 
nungsführer oder durch das Gefühl ‚selbst nichts beitragen zu können‘. Um diesen 
Effekt möglichst gering zu halten, wird in der Durchführung der Focus Groups Wert 
auf eine aktive Moderation gelegt (vgl. Abschnitt 7.4) und bereits bei der Zusam- 
menstellung der Gruppen auf eine gezielte Auswahl der Teilnehmenden geachtet 
(vgl. Abschnitt 7.3). 

Die Überlegenheit des Gruppensettings für das Forschungsinteresse im Vergleich 
zu — beispielsweise in der Kommunikationswissenschaft häufig eingesetzten Ein- 
zelgesprächen® - zeigt sich bereits im Pretest des Leitfadens (vgl. Abschnitt 7.2). 
In einem ersten Test wird der Leitfaden in Einzelinterviews getestet. Bei Menschen 
ohne Kenntnisse zum automatisierten Journalismus zeigt sich deutlich, dass sich 
die Fragen des Leitfadens schnell erschöpfen, weil keine weitere Reflexion oder 
Gesprächsanregung stattfindet. Dies ist weder im zweiten Pretest in einem Grup- 
pensetting, noch bei der Durchführung der Interviews aufgetreten: Im Austausch 
in der Gruppe konnten alle Fragen besprochen werden und auch Menschen ohne 
Vorkenntnisse haben umfassend ihre Wahrnehmung des automatisierten Journalis- 
mus mitgeteilt. Im Gruppensetting steht das Individuum und seine Wahrnehmung 
des automatisierten Journalismus im Mittelpunkt, weniger ein Gruppenprozess oder 
eine Gruppendynamik; deshalb sind Focus Groups den offenen Gruppendiskussio- 
nen vorzuziehen. Um die angesprochenen Grenzen und Nachteile der Methode zu 
berücksichtigen und deren Effekte möglichst gering zu halten, wird Wert auf die 
Vorbereitung der Datenerhebung, die Ausarbeitung des Leitfadens und insbesondere 
die Schulung der Moderatorin gelegt. 


5 Dieses Gefühl wird im Pretest im Einzelsetting mehrfach erwähnt (vgl. Abschnitt 7.2). 


6 Um eine vergleichbare Reflexion und ein Sich-Aufeinander-Beziehen in Einzelgesprä- 
chen auch nur im Ansatz leisten zu können, hätten die Einzelinterviews mit den Pro- 
band:innen zu mehreren Zeitpunkten erfolgen müssen und, ähnlich wie bei mehrstufigen 
Delphi-Befragungen, die Inhalte der ersten Gesprächsrunde in den zweiten Interviews disku- 
tiert werden müssen. Das ist aber keine natürliche Gesprächssituation und nicht vergleich- 
bar mit dem direkten Austausch in der Gruppe. Mehrstufige Einzelgespräche sind demnach 
weniger effektiv und Focus Groups tatsächlich auch forschungsökonomisch leichter und öko- 
nomischer umzusetzen. 
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7.2 Vorbereitung mit Entwicklung des Leitfadens und 
Moderationsschulung 


Ziel der Focus Groups sind offene, aber gleichzeitig strukturierte ‘Gruppengesprä- 
che mit Fokus auf das Erkenntnisinteresse. Diesen Prinzipien folgt auch die Erstel- 
lung des Leitfadens, der im Folgenden dokumentiert ist. Dieser soll offen und fle- 
xibel in der Handhabung sein, damit möglichst natürliche Gesprächssituationen 
zwischen den Teilnehmenden entstehen können, aber gleichzeitig eine klare Struk- 
tur und einen inhaltlichen Fokus haben, damit die Moderatorin den Redefluss der 
Gruppe unterstützen und bei Abweichung vom Thema die Gruppe auf das Erkennt- 
nisinteresse zurückführen kann, möglichst ohne das Gespräch zu unterbrechen. Hier 
wird die Notwendigkeit der Kompetenz der Moderation deutlich, die Relevanz einer 
guten Vorbereitung durch den Leitfaden ist aber ebenso eminent. 

Zur Entwicklung des Leitfadens wird insbesondere mit dem SPSS-Prinzip von 
Cornelia Helfferich (vgl. Helfferich 2011: 182-185) und den Praxisanregungen 
von Kühn und Koschel (2018: 91-133) gearbeitet. Anschließend wird der Leitfa- 
den einem Pretest unterzogen und das Feedback’ eingearbeitet. Die Interviews des 


7 Der Leitfaden wurde in einem zweistufigen Verfahren einem Pretest unterzogen. Zunächst 
wurde er in zwei Einzelinterviews verwendet und anschließend in einer Gruppensituation 
mit vier Teilnehmenden getestet. Die Dauer der Einzelinterviews lag bei 35 und 40 Minuten, 
das Gruppeninterview hat 70 Minuten gedauert. Bei den Einzelinterviews war eine Probandin 
Mitte 50, wenig-technologieaffin, regelmäßige Nachrichtenkonsumentin, sie gab ein mittleres 
Vertrauensniveau in Journalismus an und hatte kein Vorwissen zum automatisierten Journa- 
lismus. Der zweite Proband war Ende 50, technologieaufgeschlossen, konsumiert regelmäßig 
Nachrichten, hat kein Vertrauen in Journalismus und von automatisierter Nachrichtenbe- 
richterstattung bisher gehört, aber keine weiteren Kenntnisse. In beiden Interviews hat der 
Leitfaden grundsätzlich gut funktioniert. Bei der Überarbeitung des Leitfadens wurden nach 
dem Gespräch eine weitere Frage hinzugefügt, einige sprachliche Glättungen vorgenommen 
sowie eine Frage, die sich nahezu doppelt, weggelassen. Insgesamt war zu sehen, dass die 
zweite Testperson mit Nicht-Vertrauen keine wesentlichen Angaben zum Vertrauen in auto- 
matisierten Journalismus machen kann. Das Nicht-Vertrauen überlagert hier die Automati- 
sierungsbedingung nahezu vollständig. Für den Forschungszweck und die Konzeption der 
Studie ist es daher richtig, im Sampling nur Proband:innen aufzunehmen, die bei Vertrauen in 
Journalismus keine Extremwerte angeben. Auch die anfängliche Sorge, dass ein politischer 
Einstieg die weitere Diskussion dominiert, hat sich im Pretest nicht bestätigt und wurde für 
die Focus Groups beibehalten. Deutlich zeigte sich aber im ersten Gespräch die Überlegen- 
heit der Gruppensituation gegenüber Einzelgesprächen bei Menschen ohne Vorwissen zum 
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Pretests dienen gleichzeitig als Moderations- und Interviewschulung, so kann 
die Moderatorin auch den Umgang mit Pausen, offene Fragen und schwierige 
Gesprächssituationen üben. Gegliedert ist der Leitfaden in einen Einstiegs-, Haupt- 
und Schlussteil. Gestaltet ist das Dokument in Tabellenform mit inhaltlicher Zuord- 
nung der jeweiligen Interviewfrage oder Erzählaufforderung zur jeweiligen For- 
schungsfrage. Außerdem sind, in Anlehnung an Helfferich (2011: 185 £.), Aufrecht- 
erhaltungsfragen formuliert. Der Leitfaden ist ausführlich im Anhang dokumentiert. 

Für die Anwendung des Leitfadens soll an dieser Stelle wiederholt auf das Prinzip 
der Offenheit hingewiesen werden. Der entwickelte Fragebogen soll zur Vorberei- 
tung der Moderation und der Struktur des Gesprächs dienen, sich aber die Flexibilität 
in der Anwendung bewahren. Das heißt, dass die Fragen zwar vorformuliert sind, es 
im Wesentlichen aber auf die Stichworte ankommt und die Frageformulierung der 
Interviewsituation angepasst werden soll (vgl. ebd.: 181). Die Struktur der Fragen 
im Leitfaden orientiert sich an den Forschungsfragen (vgl. Kapitel 6) und ist nach 
dem Prinzip ‚Vom Allgemeinen zum Speziellen‘ angeordnet, dennoch ist weder die 
Reihenfolge noch jede einzelne Frage unabdingbar. Auch hier ist Flexibilität der 
Moderation nötig, sodass Fragen, die bereits beantwortet wurden, nicht noch ein- 
mal gestellt werden oder geeignete Fragen vorgezogen werden sollen, wenn dadurch 
der Gesprächsfluss in Gang bleibt. Demografische Angaben sowie Informationen 
zu Vorwissen, der Informationsnutzung und der Technikaffinität der Teilnehmenden 
werden vorab mittels Fragebogen erhoben (vgl. Abschnitt 7.3 und 9.3). 


automatisierten Journalismus (vgl. Auswahl der Methode in Abschnitt 7.1). Nach den Einzel- 
interviews fand für den zweiten Pretest eine Gruppendiskussion mit vier Teilnehmenden statt. 
Ziel des Gesprächs war der erneute Test des Leitfadens sowie die Übung einer schwierigen 
Gruppensituation für die Moderatorin. Hierfür wurde ein Teilnehmender vor dem Gespräch 
aufgefordert, sich eher unkooperativ und dominant zu verhalten sowie eine Teilnehmerin ein- 
geladen, die kein Vorwissen zum automatisierten Journalismus hat und sich grundsätzlich eher 
zurückhaltend verhält. Die Übung der Gruppensituation war hilfreich für die Moderatorin; sie 
konnte Methoden zur Gesprächslenkung verbessern. Auch in der Gruppensituation hat der 
Leitfaden für eine strukturierte, aber offene Gesprächssituation mit Fokus auf das Erkennt- 
nisinteresse funktioniert. Nach dem abschließenden Feedback der Teilnehmenden wird die 
Beschreibung eines möglichen Zukunftsszenarios (siehe Frage 10, Leitfaden im Appendix) 
verbessert. 
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73 Auswahl der Teilnehmenden und Überblick über die 
Focus Groups 


Das Forschungsinteresse der vorliegenden Arbeit gilt zum einen der Exploration 
und zum anderen der Vertiefung beziehungsweise der Erweiterung der bisherigen 
Erkenntnisse zum Vertrauen der Lesenden in automatisierten Journalismus. Um die 
Methode der Focus Groups für beide Ziele möglichst gewinnbringend einsetzen 
und insbesondere Teilnehmenden mit sehr unterschiedlichen technologischen und 
medienbezogenen Hintergründen einbinden zu können, werden drei Focus Groups 
mit unterschiedlichen Schwerpunkten konzipiert: Für die Exploration sind klassisch 
heterogene Focus Groups ideal, für eine intensiven Gesprächsaustausch auf einem 
hohen fachlichen Niveau werden zusätzlich zwei Focus Groups mit einem inhaltli- 
chen Schwerpunkt, einmal hohe Technikaffinität und einmal hohe Medienkompe- 
tenz, konzipiert. Insgesamt erfolgt die Auswahl aller Teilnehmenden zusätzlich zur 
Zuteilung zu einer Focus Group, durch die bewusste Kontrolle bestimmter Merk- 
male mittels festgelegtem Quotenplan und definierten Mindestangaben, um insge- 
samt eine möglichst breite Varianz an Teilnehmenden zu erzielen (vgl. Lamnek und 
Krell 2016: 409). Berücksichtigt werden hier demografische Merkmale wie Alter, 
Geschlecht, formaler Bildungsstand und beruflicher Hintergrund sowie das Lesever- 
halten beziehungsweise die Informationsnutzung, die Technologieaufgeschlossen- 
heit sowie das Vorwissen zum automatisierten Journalismus®. Kontrolliert werden 
im Sampling zusätzlich der kulturelle Hintergrund, das allgemeine Journalismus- 
vertrauen und ein vorhandener journalistischer Hintergrund. Die Kriterien werden 
im Vorfeld der Rekrutierung festgelegt und im weiteren Sampling nicht verändert. 


Begründung der Kriterienauswahl 

Die Auswahl der Kriterien und die Zusammensetzung der Focus Groups fußt ins- 
besondere auf der Ausarbeitung des Forschungsstands bisheriger Rezeptionsstu- 
dien zu computergenerierten Nachrichtentexten (vgl. Kapitel 5) und den dort dar- 
gestellten möglichen Einflussfaktoren auf die Wahrnehmung der computergene- 
rierten Nachrichtentexte. Insbesondere die Informationsnutzung, die Technikbereit- 
schaft und das Vorwissen zum automatisierten Journalismus sind Merkmale, die in 
den quantitativen Studien als Einflussfaktoren berücksichtigt werden, unterschied- 
liche Ergebnisse zeigen und einer Überprüfung oder intensiveren Auseinanderset- 
zung bedürfen. Die intersubjektive Überprüfbarkeit und Nachvollziehbarkeit der 
Rekrutierung erfordert zunächst eine Erläuterung der Kriterienauswahl sowie der 


8 Die demografischen Merkmale und die Auswahl weiterer Kriterien werden im Folgeab- 
schnitt aufgeschlüsselt. 
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Darstellung der verwendeten Fragekonstrukte zur Erhebung der genannten Krite- 
rien. Umgesetzt wird die Abfrage der Kriterien über einen Screening-Fragebogen, 
den die Teilnehmenden bei der Rekrutierung ausfüllen (vgl. Folgeabschnitt sowie 
Appendix Screening-Fragebogen). 

Grundsätzlich dienen die demografischen Merkmale zur Kontrolle und Einord- 
nung der Studienergebnisse und weniger als Grundlage für die Zusammensetzung 
der Focus Groups. Allerdings werden nur Personen berücksichtigt, die Deutsch auf 
Muttersprachniveau sprechen und in der Bundesrepublik leben. Diese Einschrän- 
kung der Studienergebnisse muss bei der Dateninterpretation berücksichtigt und in 
Folgestudien thematisiert werden, trägt aber der Kritik der bisherigen Rezeptionsstu- 
dien von beispielsweise Liu und Wei (2019) und Waddell (2019) Rechnung. In den 
Arbeiten wird ein möglicher Einfluss der Muttersprache auf die Wahrnehmung com- 
putergenerierter Nachrichten thematisiert (vgl. ausführlich in Abschnitt 5). Auch 
wenn in der vorliegenden Arbeit nicht die konkreten Textstimuli im Mittelpunkt 
stehen, soll mit Beschränkung auf Wohnort und Muttersprache neben dem Sprach- 
verständnis auch eine Sozialisation im deutschen Mediensystem und ein routinierter 
Umgang mit deutschen Nachrichten kontrolliert werden. Da es um die Wahrneh- 
mung des automatisierten Journalismus durch Rezipierende geht, werden weiterhin 
Personen ausgeschlossen, die als Journalist oder Journalistin tätig sind. 

Die allgemeine Vertrauensfrage in Journalismus wird in den quantitativen Befra- 
gungen (vgl. Kapitel 5) zwar nicht als möglicher Einflussfaktor berücksichtigt, ihr 
Einfluss wird aber in der Vertrauensforschung hervorgehoben und deshalb in den 
Screeningfragebogen aufgenommen. Operationalisiert wird die allgemeine Vertrau- 
ensabfrage als Globalabfrage, vergleichbar mit der Frage im jährlich erscheinenden 
Digital News Report (vgl. Hölig et al. 2021: 24). Berücksichtigt werden nur Perso- 
nen, die über ein mittleres Vertrauensniveau in Journalismus als System berichten. 
Hier geht es insbesondere um den Ausschluss von Extremmeinungen, die in Folge- 
studien angesprochen werden müssen. Valide erscheint das Vorgehen insbesondere 
nach Auswertung der Vertrauensniveaus gegenüber Journalismus in der deutschen 
Bevölkerung; hier zeigen die Daten, dass die Mehrheit der Bevölkerung Journa- 
lismus überwiegend vertraut (vgl. Abschnitt 4.5.1). Die Informationsnutzung wird 
sowohl bei den quantitativen Befragungen als auch in der Vertrauensforschung (vgl. 
Obermaier 2020; Prochazka 2020) abgefragt. Zu dem Aspekt wird in dieser Arbeit 
auf die Frageformulierung von Hasebrink et al. (2021) zurückgegriffen, allerdings 
wird nur nach dem Lesen informativer Beiträge gefragt (vgl. ebd.: 81). Die Medien- 
kompetenz der Teilnehmenden wird im Screeningfragebogen nicht gesondert erho- 
ben, die Teilnehmerinnen und Teilnehmer der Focus Group mit Schwerpunkt der 
hoch Medienkompetenten werden aber nur aus Personen rekrutiert, die das Master- 
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studium der Kommunikationswissenschaft an der Universität Bamberg erfolgreich 
abgeschlossen haben. 

Die Technologieaufgeschlossenheit wird im Forschungsstand nicht direkt erho- 
ben, sondern über die Zugehörigkeit zu einer Nation oder einer Kultur, zum Beispiel 
Singapur im Vergleich zu Europa oder China im Vergleich zu den USA, thematisiert 
(vgl. Kapitel 5). In der vorliegenden Arbeit wird zur Erfassung der Technologieauf- 
geschlossenheit die validierte Kurzskala zur Technikbereitschaft (vgl. Neyer et al. 
2016) verwendet. Das Konstrukt „soll den erfolgreichen Umgang mit neuen Tech- 
nologien insbesondere im höheren Lebensalter vorhersagen“ (ebd.: 1) und besteht 
aus den Dimensionen Technikakzeptanz, Technikkompetenz- und Technikkontroll- 
überzeugungen. Die Validitätsprüfung zeigt für alle Altersgruppen stabile Ergeb- 
nisse; die Dimensionen können zwar auch einzeln verwendet werden, werden im 
Screeningfragebogen aber als Gesamtkonstrukt erhoben. Neben der Technologie- 
aufgeschlossenheit wird im Forschungsstand auch das Vorwissen zu automatisierten 
Nachrichten oder eine bewusste Nutzung computergenerierter Berichterstattung als 
möglicher Einflussfaktor aufgelistet beziehungsweise im Forschungsausblick the- 
matisiert (vgl. 5.2.3). Die Abfrage des Vorwissens erfolgt mittels einfacher Abfrage 


und vier möglichen Antworten’. 


Quotenplan 
Wie bereits beschrieben, werden nur Personen berücksichtigt, die Deutsch auf Mut- 
tersprachniveau sprechen, und in der Bundesrepublik leben, mittleres Vertrauen 
in Journalismus angeben und keinen journalistischen Hintergrund haben. Weiter- 
hin soll eine heterogene Focus Group sowie zwei Focus Groups mit inhaltlichem 
Schwerpunkt, hohe Technikreflexion und hohe Medienkompetenz, stattfinden. 
Zusätzlich zu den genannten Schwerpunkten der Focus Groups wird ein Quoten- 
plan mit folgenden Kriterien für alle Teilnehmenden festlegt: Grundsätzlich werden 
mindestens fünfzehn Teilnehmende angestrebt, mit jeweils fünf Teilnehmenden je 
Focus Group. In der Regel können Forschungsziele mit zwei bis fünf Focus Groups 
erreicht werden (vgl. Lamnek und Krell 2016: 411), deshalb wird in der Planung 
angenommen, dass das Forschungsziel mit drei Focus Groups erreicht werden kann. 


? Die Frage lautet: „Was wissen Sie über Computerprogramme, die ohne menschliches Zutun 
Nachrichten für Zeitungen, Radio und TV schreiben?“ Die Antwortmöglichkeiten sind: (1) 
Davon habe ich noch nie gehört., (2) Davon habe ich bisher wenig gehört., (3) Davon habe 
ich schon viel gehört., (4) Davon habe ich schon gehört und ich habe auch schon computer- 
generierte Nachrichten genutzt (siehe dazu Screening-Fragebogen im Anhang). 
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1. Alter: Drei Teilnehmende zwischen 18 und 30, drei zwischen 31 und 45 Jahren, 
drei über 45 Jahre. 

2. Geschlecht: Eine annähernde Gleichverteilung der Geschlechter soll insgesamt 
und auch innerhalb der Focus Groups erzielt werden. 

3. Formale Bildung: Insgesamt mindestens drei Teilnehmende ohne Abitur. 

4. Beschäftigung: Möglichst unterschiedliche Hintergründe vor allem in Focus 
Group I (Durchschnitt). 

5. Informationsnutzung: Je Focus Group unterschiedliche Niveaus, dazu jeweils 
mindestens eine Person mit wenig Nachrichtenkonsum (,‚selten‘ bis ‚mehrfach 
pro Woche‘) und eine Person mit hohem Nachrichtenkonsum (‚mehrfach täglich‘ 
oder ‚täglich‘). 

6. Technologieaufgeschlossenheit: In Focus Group II (Technologie) ist eine 
hohe Technologieaufgeschlossenheit Voraussetzung für die Teilnahme. In Focus 
Group I (Durchschnitt) und III (Medien) sind unterschiedliche Niveaus 
erwünscht: jeweils mindestens eine Person mit hoher Technologieaufgeschlos- 
senheit und eine Person mit geringer Technologieaufgeschlossenheit. 

7. Vorwissen automatisierter Journalismus: Je Focus Group sind unterschied- 
liche Niveaus erwünscht; jeweils mindestens eine Person mit Vorkenntnissen 
(‚genutzt‘ oder ‚viel gehört‘) und eine Person ohne Vorkenntnisse (‚wenig 
gehört‘ oder ‚noch nie gehört‘). 


Schwierigkeiten können in Focus Groups durch stille Teilnehmende (vgl. 
Abschnitt 7.1) auftreten und durch das Online-Setting und Menschen mit unter- 
schiedlichem Vorwissen noch verstärkt werden. Neben der bewussten Wahrneh- 
mung dieser Problematik durch die Moderatorin werden vergleichsweise kleine 
Gruppen gewählt und bei Focus Group I (Durchschnitt) und II (Technologie) auf 
eine homogene Zusammensetzung der Gruppe geachtet. Durchgeführt werden die 
Focus Groups mit fünf bis sechs Teilnehmenden pro Gruppe. Diese Gruppengröße 
erscheint bereits im Pretest sinnvoll und hat zudem forschungspraktische Gründe 
in der Anwendung des Videokonferenzsystems Zoom, da bei sechs bis sieben Kon- 
ferenzteilnehmenden inklusive der Moderatorin noch ein guter Überblick möglich 
ist. Zudem ist die Aktivierung einzelner Teilnehmender insbesondere im Online- 
Setting eine Herausforderung, damit sind sechs Teilnehmende das Maximum für 
einen lebendigen Austausch. 

Lamnek und Krell (ebd.) diskutieren ausführlich die Zusammenstellung homo- 
gener und heterogener Focus Groups sowie Real- und Ad-Hoc-Gruppen mit Blick 
auf die Datensammlung und das Forschungsziel (vgl. ebd.: 407f., 410f.). Dabei 
sind für unterschiedliche Forschungszwecke unterschiedliche Zusammensetzun- 
gen geeignet. Wichtig ist die ausführliche Dokumentation der Rekrutierung für die 
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intersubjektive Überprüfbarkeit. Homogene Gruppen und „persönliche Bekannt- 
schaft verhindert manchmal die notwendige Offenheit, weil Konflikte über die Grup- 
pendiskussionsdauer hinaus befürchtet werden. Profilierungssucht mag zu Denun- 
ziationen oder zu Dominanzen führen, die das Gruppengefüge belasten“ (ebd.: 407). 
Natürlich zusammengestellte Gruppen haben aber den Vorteil eines gemeinsamen 
Gesprächgegenstands und Bezugsystems und kommen meist schneller in eine Dis- 
kussion (vgl. ebd.: 411). Eine breite Themenvielfalt und der Austausch vielfälti- 
ger Argumente kann auch in einer homogenen Gruppe stattfinden, weil jede Focus 
Group eine Eigendynamik entwickelt und „[mJenschliches Handeln [...] derart kom- 
plex und an vielfältige Einflussfaktoren gebunden [ist], dass es nie durch die Wahl 
eines Gruppenzugehörigkeitsmerkmals als vorbestimmt gelten darf‘ (Kühn und 
Koschel 2018: 68). Für die vorliegende Arbeit bedeutet dies, dass im Sampling mög- 
liche negative Konsequenzen der homogenen Zusammenstellung der Focus Groups 
II (Technologie) und III (Medien) bedacht werden müssen und - insbesondere in der 
Moderation — darauf geachtet wird, dass eine hohe soziale Erwünschtheit, festgefah- 
rene Rollenfunktionen oder ein nicht-angesprochener Common Sense berücksich- 
tigt werden (vgl. Kühn und Koschel 2018: 69 f.; Brosius et al. 2016: 92£.). Für das 
beschriebene Forschungsziel werden eine heterogen und künstlich zusammenge- 
stellte Gruppe und zwei vergleichsweise homogene, natürlich zusammengestellte 
Gruppen mit gemeinsamem Hintergrund des politischen Engagements oder des 
gemeinsamen Studiums rekrutiert. Dies erscheint aus einer Abwägung der unter- 
schiedlichen Vor- und Nachteile der Zusammenstellung von Focus Groups geeignet, 
um das Forschungsziel der Exploration und der Vertiefung bisheriger Erkenntnisse 
zum Vertrauen der Lesenden in automatisierten Journalismus zu verbinden. 

Die Rekrutierung erfolgt zunächst über die direkte Ansprache potentieller Teil- 
nehmerinnen und Teilnehmer in den persönlichen Netzwerken der Autorin. Weiter- 
hin werden die angesprochenen Personen gebeten, die Forschungsanfrage in ihren 
Netzwerken zu empfehlen und weiter zu verbreiten. Sobald mögliche Teilnehmende 
Interesse zeigen, wird der personalisierte Online-Screeningfragebogen (vgl. Appen- 
dix Screeningfragebogen) versandt und wenn die oben genannten Kriterien erfüllt 
sind, erfolgt eine Zuordnung zur jeweiligen Focus Group und die Terminauswahl'". 


10 Zur Wahrung des Datenschutzes werden mögliche Teilnehmer:innen nach ihrer Einwilli- 
gung zur Teilnahme und ihren Kontaktdaten gefragt und erst nach den Hinweisen und Erklä- 
rungen zum Datenschutz wird der personalisierte Screeningfragebogen per E-Mail versandt. 
So ist sowohl die Zuordnung der Daten zu den jeweiligen Teilnehmer:innen für die Zusam- 
mensetzung der homogenen Focus Groups sowie die Einwilligung in die temporäre Sammlung 
personenbezogener Daten gewährleistet. Umgesetzt wird der Fragebogen mit SoSci-Survey. 
Der Fragebogen ist im Anhang veröffentlicht. 
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Insgesamt hatte die Autorin in der Rekrutierung direkten und indirekten Kontakt 
mit mindestens 100 potentiellen Teilnehmenden. 

Die Rekrutierung der Teilnehmenden für die Focus Groups mit Themenschwer- 
punkten erfolgt dabei zielgerichtet (vgl. Tabelle 7.1). In Focus Group II (Technolo- 
gie) werden Personen interviewt, die in besonderem Maße technologieaffin bezie- 
hungsweise technologiereflektiert agieren. Dazu werden gezielt Menschen ange- 
sprochen, die mit der Autorin vor über zehn Jahren in der Piratenpartei Deutschland 
auf Kommunal-, Bezirk-, Landes- und Bundesebene politisch aktiv waren und sich 
intensiv mit Digital- und Netzpolitik beschäftigten. Heute sind weder die Auto- 
rin noch die angesprochenen Teilnehmerinnen und Teilnehmer noch in der Partei 
aktiv, wenngleich sich viele in HackerSpaces, digitalpolitischen Netzwerken oder 
Gremien zur Entwicklung Künstlicher Intelligenzen engagieren und mehrheitlich 
im IT-Sektor oder der IT-Sicherheit arbeiten. Die Teilnehmenden der Focus Group 
II (Medien) zeichnen sich durch hohe Medienkompetenz aus und werden aus den 
Absolvent:innen des Masterstudiengangs Kommunikationswissenschaft der Uni- 
versität Bamberg rekrutiert, die aber nicht im Journalismus arbeiten. Diese Pro- 
band:innen haben sich im Zuge ihres Studiums intensiv mit Journalismus als Sys- 
tem, dem Berufsbild und Wandlungs- und Transformationsprozessen beschäftigt. 
Sie arbeiten aktuell in der Presse- und Öffentlichkeitsarbeit von Unternehmen oder 
Behörden oder als freie Marketing- und Kommunikationsberater:innen. Wichtig 
bei der Auswahl der Proband:innen in Focus Group II ist eine hohe Medienkompe- 
tenz, aber explizit kein journalistischer Hintergrund. Die vorliegende Arbeit unter- 
sucht die Wahrnehmung von Rezipient:innen und nicht die von Journalist:innen. 
Zur Rekrutierung muss an dieser Stelle dokumentiert werden, dass insbesondere 
bei den Focus Groups mit Themenschwerpunkt nicht der „Königsweg in das Feld“ 
(Meyen et al. 2011: 75) über Dritte realisiert werden konnte, sondern persönlicher 
Kontakt zur Autorin bestand. Allerdings ist der Kontakt sehr lose und die Teilneh- 
menden hatten zuletzt vor mindestens drei, im Durchschnitt fünf Jahren Kontakt zur 
Autorin und zählen nicht zum engeren Freundes- und Bekanntenkreis. Vorteil dieser 
zielgerichteten Rekrutierung ist der gemeinsame Erzählgegenstand der Teilnehmen- 
den (‚das politische Engagement‘ und ‚das Studium‘), dass sich alle lose kennen, 
seit Längerem in der Gruppenkonstellation nicht gesehen haben und im besten Fall 
Freude am Wiedersehen entwickeln und sich ein lockeres Gespräch ergibt. 
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7.4 Durchführung und inhaltliche Zielsetzung der Focus 
Groups 


Die Datenerhebung findet im Juni und Juli 2022 statt. Durchgeführt werden drei 
Online-Focus Groups mit Hilfe des Videokonferenzsystems Zoom. In zwei Grup- 
pen nehmen fünf Teilnehmerinnen und Teilnehmer teil und in einer Gruppe sechs 
Proband:innen. Jedes Gespräch dauert etwa 80 Minuten, kein Teilnehmer hat das 
Gespräch früher abgebrochen. Zur Auswertung werden jeweils sowohl eine Ton- als 
auch eine Videoaufzeichnung erstellt, wobei die Videoaufzeichnung nicht geson- 
dert ausgewertet wird'!. Die Aufnahme startet nach einer kurzen Einführung durch 
die Moderation und endet mit Abschluss des Leitfadens. Nach dem Aufnahme- 
stopp wird das Thema abgebunden und weitere Fragen der Teilnehmenden, zum 
Beispiel zum Forschungsstand, kurz beantwortet. Nach Abschluss der Gespräche 
wird jeweils ein Postskriptum erstellt (vgl. Abschnitt 7.6). 

Im Mittelpunkt der Focus Groups steht der entwickelte Leitfaden (vgl. 
Abschnitt 7.2) und dem Ziel, den inhaltlichen Fokus der Gespräche mit einer offe- 
nen, aktivierenden und lockeren Gesprächsatmosphäre zu verbinden. Der Leitfa- 
den dient als Orientierung und soll das Gespräch strukturieren. In den Gesprächen 
werden jeweils alle Fragen des Leitfadens thematisiert und angesprochen, wobei 
weder die exakte Reihenfolge noch die genaue Frageformulierung notwendiger- 
weise einzuhalten ist. Abhängig von den Äußerungen der Teilnehmenden werden 
im Gespräch zudem gezielte Nachfragen oder ergänzende Fragen eingeführt, um 
weitere Einschätzungen oder detailliertere Beschreibungen und Reflexionen der 
Teilnehmenden zu generieren. Der Struktur der Forschungsfragen und des Leitfa- 
dens folgend, sind die Gespräche in drei thematische Hauptblöcke gegliedert: 


1. Einleitung und Hinführung zum Thema: Im Rahmen der Einführung werden 
die Teilnehmenden zu ersten Erfahrungen mit automatisierter Kommunikation 
befragt, das Forschungsthema kurz vorgestellt, und es erfolgt die Hinführung 
zum Vertrauensbegriff. Ziel des Einführungsblocks ist außerdem die Herstellung 
einer angenehmen Gesprächssituation, das Einüben und Sich-Vertraut-Machen 
mit der Videokonferenzsituation, die Aktivierung aller Teilnehmenden sowie ein 
leichter Einstieg in das Thema. 


11 Anm: Die Videoaufzeichnung wird nur für die mögliche Zuordnung unverständlicher Aus- 
sagen des Transkripts verwendet. Siehe Auswertung 7.6. 
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2. Die Wahrnehmung des automatisierten Journalismus und seiner Spezifika: 
Der Hauptteil der Focus Groups thematisiert die entwickelten Forschungs- und 
Detailfragen (vgl. Abschnitt 6.3) und ist der Struktur folgend in zwei Unter- 
blöcke geteilt. Zunächst bezieht sich das Gespräch auf die Wahrnehmung der 
automatisiert generierten Nachrichten durch die Lesenden und ihr Vertrauen in 
automatisierten Journalismus. Überdies wird die Bedeutung der Automatisie- 
rung für das Vertrauen in Journalismus im Allgemeinen thematisiert und die 
Erwartungen an vertrauensbildende Maßnahmen im automatisierten Journalis- 
mus werden angesprochen. Im zweiten Block werden spezifische Eigenschaften 
der automatisierten Berichterstattung und ihr Einfluss auf die Vertrauensbewer- 
tung thematisiert. Den Forschungsfragen folgend wird beispielsweise diskutiert, 
welchen Einfluss eine Kennzeichnung der Texte, das Thema, die Darstellungs- 
form oder die Medienrezeption einer Roboterdarstellung auf eine Vertrauens- 
bewertung haben. Am Ende des Hauptteils wird nach weiteren Einflussfaktoren 
auf die Vertrauensbewertung und offen gebliebenen Themen gefragt. 

Im Hauptteil kommen als Stimuli für das Gespräch die Darstellung dreier 
Praxisbeispiele und die mündliche Vorstellung möglicher Zukunftsszenarien der 
automatisierten Berichterstattung zum Einsatz. Der Stimulus wird im folgenden 
Abschnitt beschrieben. Außerdem werden im Hauptteil Aktivierungen einge- 
setzt, die für eine Ausgewogenheit der Redebeiträge in der Gruppe sorgen und 
es werden Aufrecht-Erhaltungsfragen verwendet, um den Redefluss anzuregen 
und stille Teilnehmende einzubinden. Weiterhin werden Projektionsfragen ver- 
wendet, um den Effekt der sozialen Erwünschtheit zu minimieren (vgl. Brosius 
et al. 2016: 92f.). 

3. Schlussteil mit Reflexion und Abbinden des Themas: Die Focus Groups 
enden, sobald alle Punkte, Gedanken, Reflexionen und Anmerkungen der Teil- 
nehmenden besprochen und abgefragt sind. Danach werden die Gespräche been- 
det, die Aufnahme gestoppt und die Teilnehmenden erneut beziehungsweise 
vertieft über das Forschungsprojekt aufgeklärt. 


Um die Teilnehmenden zu aktivieren und eine weitere Reflexion anzustoßen wird 
mit Praxisbeispielen, einem aktuellen Anwendungsfall sowie mit einem mögli- 
chen Zukunftsszenario gearbeitet. Für die Darstellung der Praxisbeispiele werden 
Screenshots von aktuellen Online-Berichten in Form einer PowerPoint-Präsentation 
vorbereitet, die den Teilnehmenden im Gespräch mittels eines geteilten Bildschirms 
der Moderatorin zur Verfügung stehen. Verwendet werden Darstellungen der auto- 
matisierten Coronaberichterstattung der Rheinischen Post, des Feinstaubmonitors 
der Stuttgarter Zeitung sowie der kommunalen Wahlberichterstattung der Berner 
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Zeitung (vgl. dazu auch Abschnitt 3.3.3. Für die Teilnehmenden ist jeweils der 
Anfang eines Artikels sowie der Transparenzhinweis sichtbar. 

Mündlich besprochen wird ein aktueller Anwendungsfall der Limitationen der 
computergenerierten Berichterstattung (vgl. Abschnitt 3.4.1): In einem rein auto- 
matisiert erzeugten Bericht können Nebenereignisse nicht abgedeckt werden. Die- 
ser Anwendungsfall wird am Beispiel eines Fußballberichts thematisiert, bei dem 
ein Flitzer als wichtiges Nebenereignis auftrat, in der Berichterstattung aber nicht 
vorkommt!?. Als Zukunftsszenario und mögliche Auswirkung der automatisierten 
Berichterstattung wird eine deutlich erhöhte Personalisierung von Nachrichtenarti- 
keln besprochen. Thematisiert wird die Möglichkeit, Nachrichten deutlich komple- 
xer auf den jeweiligen Leser oder die Leserin anzupassen. Angesprochen wird die 
ökonomische Möglichkeit, durch die Algorithmisierung eine höhere Themenvielfalt 
anzubieten, die individuell angepasst werden kann. Zudem wird auch eine mögliche 
Personalisierung der Nachrichteninhalte vorgestellt, indem auch die dargestellten 
Informationen, die Wortwahl, die Syntax, das Sprachniveau individuell angepasst 
werden können. 


7.5 Beschreibung der Stichprobe und Zusammensetzung 
der Focus Groups 


Die Focus Groups setzen sich wie in Tabelle 7.1 erfasst zusammen. Die Namen sind 
pseudonyomisiert. 


12 Yon zwei Teilnehmenden wurde angemerkt, dass das Beispiel nicht passend gewählt ist, 
da Flitzer in der Berichterstattung sowieso nicht vorkommen, um mögliche Nachahmer 
zu vermeiden. Dennoch wird das Beispiel zur Aktivierung beibehalten, weil es eingän- 
gig ist und unerwartete Nebeneffekte damit gut verdeutlicht werden können. Nach den 
Anmerkungen der Teilnehmer wurde das Gespräch auf Spielunterbrechung durch politische 
Aktionen, wie z. B. den Greenpeace-Stadion-Flug, gelenkt vgl. dazu: https://www.spiegel. 
de/panorama/gesellschaft/greenpeace-aktion-bei-fussball-em-spiel-krass-idiotische-und- 
unverantwortliche-aktion-a-27b560f4-322d-420a-9524-1a7aa62c3d55. (Letzter Zugriff: 
15.11.2022) 
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Insgesamt nahmen sieben Männer und neun Frauen im Alter zwischen 29 und 
72 Jahren an der Studie teil, das Medianalter aller Teilnehmenden liegt bei 33 Jah- 
ren. Der Quotenplan kann hinsichtlich des Alters, der Geschlechterverteilung, der 
formalen Bildungsabschlüsse'?, der Informationsnutzung sowie des Vorwissens 
zu automatisierten Journalismus der Teilnehmenden erfüllt werden. Nicht erfüllt 
werden heterogene Beschäftigungshintergründe unter allen Teilnehmenden und das 
Kriterium der unterschiedlichen Technologieaufgeschlossenheit in Focus Group III 
(Medien): Hier geben die Teilnehmenden alle eine eher höhere Technikaffinität 
an. Dies ist eine im Feld vermutlich nicht aufzulösende Schwierigkeit, da Absol- 
vent:innen eines Masterstudiums, dessen Studieninhalt auch die Nutzung digitaler 
Technologien umfasst, eine höhere Technikaffinität aufweisen werden als beispiels- 
weise der Durchschnitt der Bevölkerung. Für den vorliegenden Forschungszweck 
ist das Vorgehen dennoch valide, da die angegebene Technikbereitschaft der Focus 
Group II (Medien) deutlich unter der Technikbereitschaft der Focus Group I (Tech- 
nologie) liegt und damit ein wesentliches Distinktionsmerkmal beider Gruppen exis- 
tiert. 


7.6 Nachbereitung der Datenerhebung, Transkription und 
Auswertungsstrategie 


Im direkten Anschluss an jede Focus Group wird ein Postskriptum angefertigt, wel- 
ches Angaben zur Selbstwahrnehmung der Interviewerin, zu situativen Aspekten des 
Interviews, zu den Gesprächsinhalten vor und nach der Tonbandaufzeichnung, zur 
Wahrnehmung nonverbaler Aspekte, spontane Gedanken zur Schwerpunktsetzung 
der Gruppe, thematische Auffälligkeiten und erste Interpretationsideen enthält. 
Nach der Datenerhebung werden die Focus Groups im Juli und August 2022 
verschriftlicht und jeweils ein vollständiges Transkript erstellt. Zur Verschriftli- 
chung von Tonaufzeichnungen gibt es in den Sozialwissenschaften unterschied- 
liche Transkriptionssysteme, die sich hinsichtlich ihrer Komplexität unterschei- 
den und festlegen, wie und in welcher Detailreiche verbale und nicht-verbale 
Äußerungen in die Verschriftlichung aufgenommen werden. Entscheidend für 
die Auswahl der jeweiligen Transkriptionsregeln sind — neben den Kosten der 


13 Auch wenn der Quotenplan hinsichtlich der formalen Bildung erfüllt ist, geben mit 13 Per- 
sonen die deutliche Mehrheit Abitur als Bildungsabschluss an. Eine Teilnehmerin gibt einen 
Haupt- oder Volksschulabschluss und zwei Teilnehmende nennen einen Realschulabschluss 
oder einen vergleichbaren Abschluss. In Focus Group III (Medien) kann keine heterogene 
Gruppe hinsichtlich des Bildungsabschlusses rekrutiert werden, da das abgeschlossene Mas- 
terstudium Zulassungsvoraussetzung ist. 
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Transkription — der Forschungszweck und das Ziel der Datenerhebung. Diese 
bestimmen, wie genau und wie verständlich Aussagen transkribiert werden. In der 
Kommunikationswissenschaft wird in der Regel Wert auf den Sinn der Aussagen 
und eine leicht verständliche Verschriftlichung gelegt, hier sind einfache Transkrip- 
tionssysteme ausreichend'* (vgl. Meyen et al. 2011: 115f.; Kuckartz 2018: 166f.). 
Neben der Verschriftlichung der Aussagen werden die Daten der Teilnehmenden 
zusätzlich anonymisiert beziehungsweise pseudonymisiert. 

Auf Basis des einfachen Transkriptionsystems von Dresing und Pehl (2018: 
21f.), den Hinweisen zur computergestützten Auswertung von Kuckartz (2018: 
167), den Empfehlungen von Meyen et al. (2011: 115£.) und den praktischen Erfah- 
rungen von Kümpel (2019) und Prochazka (2020) werden folgende Transkriptions- 
regeln definiert und umgesetzt: 


e Es wird wörtlich transkribiert. Dialekte werden nicht transkribiert, sondern mög- 
lichst wortgenau ins Hochdeutsche übersetzt. 

e Sprache und Interpunktion werden leicht geglättet, das heißt an das Schrift- 
deutsch angenähert. Wortverschleifungen werden an das Schriftdeutsch ange- 
passt. 

e Füllwörter (wie ‚halt‘, ‚eben‘, ‚irgendwo‘, irgendwie‘), umgangssprachliche 
Partikel (wie ‚gelle‘, ‚ne‘, ‚ja ne‘), Rezeptionssignale (wie ‚hm‘, ‚ja‘, ‚genau‘, 
‚also naja‘) werden nicht transkribiert, sofern sie die Aussage nicht unterstüt- 
zen oder verdeutlichen. Wenn Rezeptionssignale die Aussage unterstützen und 
demzufolge transkribiert werden, wird in Klammern notiert, ob die Äußerung 
als zustimmend oder ablehnend wahrgenommen wird. 

e Stottern wird geglättet. Abgebrochene Wörter und abgebrochene Sätze werden 
ignoriert, sofern sie die Aussagen nicht unterstützen oder verdeutlichen. Abge- 
brochene Sätze, die für das Forschungsziel wichtig erscheinen und deshalb tran- 
skribiert werden, werden mit (-) gekennzeichnet. 

e Wortdoppelungen und Wiederholungen werden nur transkribiert, sofern sie die 
Aussage unterstützen oder verdeutlichen. 

e Die Interpunktion wird zugunsten der Lesbarkeit geglättet, das heißt, bei kurzem 
Senken der Stimme oder nicht eindeutiger Betonung wird eher ein Punkt als ein 
Komma gesetzt. Sinneinheiten sollten beibehalten werden. 

e Besonders betonte Wörter werden in Großschrift kenntlich gemacht. 


14 Meyen et al. (2011) weisen darauf hin, dass der „Aufwand [...] an das Ziel angepasst werden 
sollte und in Zweifelsfällen ja immer noch das Originalmaterial zur Verfügung [steht]“ (ebd.: 
116). 
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e Deutliche, längere Pausen (ab circa drei Sekunden) werden durch Klammern 
(Pause) oder (...) markiert. Eine weitere Unterscheidung der Pausenlänge findet 
nicht statt. 

e Emotionale nonverbale Äußerungen, die die Aussagen unterstützen oder verdeut- 
lichen oder der besseren Interpretation dienen, werden beim Einsatz in eckigen 
Klammern notiert [lachen]. 

e Die Beiträge der Interviewerin werden mit I: gekennzeichnet; die Aussagen der 
Teilnehmenden jeweils mit einem Namenskürzel. 

e Die Focus Groups werden durchnummeriert. Innerhalb einer Focus Group erhält 
jeder Beitrag einen eigenen Absatz. Auch kurze, inhaltlich relevante Einwürfe 
werden in einem separaten Absatz transkribiert. Mindestens am Ende eines 
Absatzes werden Zeitmarken eingefügt. 

e Nebengeräusche, die wichtig für die Auswertung oder Interpretation sind, wer- 
den in eckigen Klammern notiert und mit einer Zeitmarke versehen. 

e Beziehen sich die Äußerungen der Teilnehmenden auf ein spezifisches Beispiel, 
so wird dies durch eckige Klammern [Rheinische Post] gekennzeichnet. 

e Alle Angaben, die einen Rückschluss auf einen Teilnehmenden erlauben, werden 
anonymisiert beziehungsweise pseudonymisiert. 


Dresing und Pehl (2018) merken an, dass bei der Erstellung eines Transkripts durch 
eine Person im Durchschnitt 37 Prozent Fehler im ersten Transkriptionsdurchlauf 
auftreten können. Sie empfehlen daher, eine zweite Person mit der Überprüfung des 
Transkripts zu beauftragen und wenn dies nicht möglich ist, zumindest mit zeitli- 
chem Abstand die Verschriftlichung der Tonaufnahme zu überprüfen (vgl. ebd.: 30). 
Aus forschungsökomischen Gründen kann das Transkript nicht durch eine zweite 
Person überprüft werden, aber der Empfehlung folgend, werden die Transkripte im 
Abstand von drei beziehungsweise vier Wochen überprüft und aufgetretene Fehler 
verbessert. 

Zur Auswertung der Interviews werden die Transkripte in MAXQDA importiert 
und mit Hilfe von Codes und Zusammenfassungen für die Auswertung zugänglich 
gemacht. Als Auswertungsstrategie wird im Schwerpunkt auf die zusammenfas- 
sende Inhaltsanalyse von Mayring (2022) zurückgegriffen und die Hinweise zur 
computergestützten Auswertung von Kuckartz (2018) berücksichtigt. Das Katego- 
riensystem ist im Anhang veröffentlicht. 
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Ergebnisse 8 


Im Folgenden werden die Ergebnisse der Focus Groups dargestellt. Dazu wird 
zunächst ein zusammenfassender Überblick über die jeweiligen Focus Groups und 
ihre Teilnehmenden vermittelt. Danach wird das jeweilige Verständnis der Lesenden 
von interpersonalem Vertrauen und Vertrauen in Journalismus als Grundlage die- 
ser Arbeit thematisiert. Anschließend folgen die Erläuterungen zur Wahrnehmung 
des automatisierten Journalismus und die Darstellung der positiven und negativen 
Erwartungen an Veränderungen im Journalismus. Zudem werden Forderungen der 
Lesenden an den Technologieeinsatz im Journalismus diskutiert. Weiterhin werden 
die Aufarbeitung der Vertrauensbewertung der Lesenden zum aktuellen Einsatz der 
automatisierten Berichterstattung, die Darstellung der Vertrauensurteile und wesent- 
licher Einflussfaktoren auf die Bewertungen erläutert. Abschließend werden — den 
Forschungsfragen folgend — ausgewählte Merkmale hinsichtlich ihres Einflusses auf 
die Vertrauensbewertung des automatisierten Journalismus thematisiert: solche der 
Personen, des automatisierten Journalismus, der Texte und der Publikation sowie 
weitere explorativ generierte Merkmale. 

Bei direkten Zitaten der Befragten werden jeweils der Name, das Alter und 
die Focus Group (Durchschnitt = Focus Group I, Technologie = Focus Group II, 
Medien = Focus Group II) angegeben. Die Namen der Teilnehmenden wurden 
pseudonymisiert. Die Transkripte werden zur Wahrung der Anonymität der Teil- 
nehmenden nicht im Appendix abgedruckt, sind aber auf Nachfrage erhältlich. Das 
Kategoriensystem ist vollständig veröffentlicht (vgl. Appendix Kategoriensystem). 
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8.1 Zusammenfassende Darstellung der Focus Groups 


Die Samplebildung und die grobe Zusammensetzung der Focus Groups wird in 
Abschnitt 7.3 besprochen! und in Tabelle 7.1 aufgeführt. Im Folgenden sollen die 
Focus Groups mit den jeweiligen Teilnehmenden genauer dargestellt und Schwer- 
punkte herausgearbeitet werden. Neben den Hinweisen zur Rekrutierung und Aus- 
wahl der Teilnehmenden sei auf den Unterschied zwischen Focus Group I sowie 
Focus Group II und II hingewiesen: Focus Group I (Durchschnitt) soll eine 
möglichst heterogene Zusammensetzung der Teilnehmenden erzielen, während für 
Focus Group II (Technologie) und III (Medien) zielgerichtet technologieaffine Per- 
sonen sowie Personen mit einer hohen Medienkompetenz ausgewählt wurden und 
beide Focus Groups damit einen themenspezifischen Fokus aufweisen (vgl. Rekru- 
tierung und Zusammensetzung Focus Groups in Abschnitt 7.3). 


8.1.1 Focus Group I - Durchschnitt 


Die Focus Group I besteht aus fünf Personen. Die Teilnehmenden sind zwischen 29 
und 72 Jahre alt. Es nehmen zwei Männer und drei Frauen teil. Vier Personen sind als 
Angestellte oder Angestellter tätig, eine Person ist in Rente. Drei Personen geben ein 
Studium als höchsten Bildungsabschluss an, eine Person einen mittleren und eine 
Person einen Volksschulabschluss. Die Informationsnutzung der Teilnehmenden ist 
unterschiedlich: So geben drei Personen an, täglich Nachrichten zu konsumieren, 
eine Person liest nach eigenen Angaben mehrfach in der Woche Zeitung, eine nutzt 
selten Nachrichtenangebote. Vier Personen geben ein mittleres Vertrauen, eine ein 
hohes Vertrauen in Journalismus an. Der Mittelwert der gemessenen Technologie- 
aufgeschlossenheit ist deutlich niedriger als der Wert in den beiden anderen Focus 
Groups. Weiterhin haben vier Personen noch nie oder wenig von automatisierten 
Journalismus gehört. Eine Teilnehmerin gibt dagegen an, automatisierten Journa- 


lismus schon genutzt zu haben, aber selten Nachrichten zu konsumieren”. 


! Insgesamt haben 16 Proband:innen in drei Focus Groups teilgenommen. Sie sind zwischen 
29 und 72 Jahre alt; eine annähernde Gleichverteilung der Geschlechter wurde erzielt. Es 
wurden nur Personen rekrutiert, die Deutsch auf Muttersprachniveau sprechen, keinen jour- 
nalistischen Hintergrund haben und ein mittleres Vertrauen in Journalismus angeben (vgl. 
Abschnitt 7.3). 

? Hier wird im weiteren Verlauf der Focus Group nicht deutlich, welches Begriffsverständnis 
die Teilnehmerin von automatisierten Journalismus genau hat (vgl. Beschreibung des Unter- 
suchungsgegenstands in Abschnitt 8.3.1). 
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8.1.2 Focus Group ll - Technologiereflektierte 


Focus Group II besteht aus fünf Personen, die im hohen Maße als technologieaffin 
beziehungsweise technologiereflektiert bezeichnet werden können. Es nehmen drei 
Männer und zwei Frauen teil, die zwischen 35 und 53 Jahre alt sind. Als höchs- 
ten Bildungsabschluss gibt eine Person einen Realschulabschluss, zwei Personen 
Abitur und zwei weitere Personen ein abgeschlossenes Studium an. Vier Personen 
arbeiten aktuell als Angestellte, eine ist Hausfrau. Drei Teilnehmende lesen mehr- 
fach pro Woche und zwei mehrfach täglich Nachrichten. Insgesamt ist das Vertrauen 
in Journalismus mehrheitlich hoch. 

In Focus Group II ist der Mittelwert der Technologieaufgeschlossenheit gemes- 
sen an allen Teilnehmenden am höchsten. Auch das Vorwissen zu automatisierten 
Journalismus ist höher als in den beiden anderen Focus Groups: Drei Personen 
haben bisher viel und zwei Personen wenig von computergenerierter Berichter- 
stattung gehört. Die hohe Technologieaufgeschlossenheit ist für die Zuordnung zu 
dieser Gruppe vorausgesetzt und im Sampling gezielt beeinflusst. Der gemeinsame 
Erzählgegenstand der Teilnehmenden ist ein früheres ehrenamtliches politisches 
Engagement in der Piratenpartei Deutschland. Dieses Engagement liegt rund zehn 
Jahre zurück und die Teilnehmenden haben sich in dieser Konstellation seither nicht 
mehr getroffen (vgl. Rekrutierung in Abschnitt 7.3). Im Gespräch wird auf das 
gemeinsame Engagement verwiesen, zum Beispiel im Zusammenhang mit Kennt- 
nissen über Journalismus und Pressearbeit oder dem wahrgenommenen Vertrauen 
in Journalismus. Aktuell arbeiten vier der fünf Teilnehmenden in der IT-Branche, 
zum Beispiel als IT-Security Consultant oder Softwareentwickler:in. Zudem sind 
einige Teilnehmende in ihrer Freizeit digitalpolitisch organisiert oder an netzpoli- 
tischen Themen interessiert. So sprechen sie über die Mitgliedschaft in Vereinen 
wie dem Chaos Computer Club, Hackerspaces oder ihr Interesse an Initiativen zum 
Einsatz von Künstlichen Intelligenzen. In Bezug auf automatisierten Journalismus 
und den Einsatz von Künstlicher Intelligenz in gesellschaftlich relevanten Bereichen 
bezeichnen sich die Teilnehmenden als technologiereflektiert oder technologiekri- 
tisch: 


Paul (35, Technologie): Ich glaube, dass die Gruppe, die hier zusammen ist, sowieso 
schon eher skeptisch dem Ganzen gegenübersteht, was sowas [Anm.: Einsatz automa- 
tisierter Journalismus] angeht als jetzt der Otto Normalbürger oder Bürgerin. 01:17:20 


Alle: Hm, ja [Zustimmung] 


Wilfried (45, Technologie): Ich würde nicht skeptisch sagen, sondern eher kritisch. 
01:17:23 


Paul (35, Technologie): Ja, das stimmt, kritisch trifft es besser. [...] 01:17:29 
(Focus Group II, Pos. 359-362) 
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8.1.3 Focus Group Ill - Medienkompetente 


In Focus Group III nehmen sechs Personen teil, die zwischen 30 und 34 Jahre alt 
sind. Es sind zwei männliche und vier weibliche Teilnehmende. Eine Person ist 
selbstständig, fünf sind angestellt. Die Teilnehmenden dieser Focus Group lesen 
insgesamt am häufigsten Nachrichten: Die eine Hälfte konsumiert mehrfach pro 
Woche und die andere Hälfte täglich bis mehrfach täglich Nachrichten. Alle Perso- 
nen geben ein hohes Vertrauen in Journalismus an. Ihre angegebene Technologie- 
aufgeschlossenheit liegt höher als der Wert in Focus Group I (Durchschnitt), aber 
weniger hoch als der Wert der Technologieaufgeschlossenen. Alle Teilnehmenden 
geben an, von automatisiertem Journalismus bisher wenig gehört zu haben. 

Der gemeinsame Erzählgegenstand dieser Focus Group ist das Studium der Kom- 
munikationswissenschaft, bei dem sich die Teilnehmenden kennengelernt haben. 
Die meisten hatten in den letzten fünf Jahren keinen Kontakt mit allen Teilneh- 
menden und unterschiedlich intensiven Kontakt zu einzelnen Teilnehmenden (vgl. 
Rekrutierung in Abschnitt 7.3). Auf die hohe Medienkompetenz oder Medienre- 
flexion wird im Gespräch selten direkt eingegangen, sondern man bezieht sich auf 
gemeinsam zugrundeliegendes Wissen über Medien und Journalismus. 


Jan (32, Medien): Gerade wenn man Medien einigermaßen kritisch betrachtet [...] 
01:08:46 


(Focus Group III, Pos. 207) 


In der Rekrutierung und in der Durchführung der Focus Group kann ein hohes 
Maß an Medienkritik für die gesamte Gruppe nicht bestätigt werden. Zudem ist 
die direkte Aussage des Teilnehmers auf weniger breite Zustimmung gestoßen als 
die technologiekritische Aussage in Focus Group II (Technologie). Deshalb wird 
die Gruppe der Teilnehmenden in Focus Group III (Medien) im Folgenden auch 
weiterhin eher als medienkompetent denn als medienkritisch bezeichnet. 
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Im folgenden Abschnitt wird zunächst die Verständigung der Teilnehmenden auf 
einen allgemeinen Vertrauensbegriff erläutert. Danach geht es um die Definition von 
Vertrauen in Journalismus als Grundlage der weiteren Ausführungen zu Vertrauen 
in automatisierten Journalismus. 
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8.2.1 Interpersonales Vertrauen 


Der interpersonale Vertrauensbegriff, den die Teilnehmenden in der empirischen 
Erhebung beschreiben, entspricht den theoretischen Ausführungen der Vertrauens- 
forschung. Die Teilnehmenden definieren interpersonales Vertrauen als die indivi- 
duelle Bereitschaft, sich als Grundlage ihres zukünftigen Handelns auf Informa- 
tionen eines (menschlichen) Gegenübers verlassen zu können, ohne eine weitere 
Überprüfung des Gesagten vornehmen zu müssen. In der Regel beziehen sich die 
Teilnehmenden bei einer allgemeinen Vertrauensfrage auf interpersonale Vertrau- 
ensobjekte, teilweise werden auch abstrakte Bezugsobjekte genannt. 


Daria (32, Medien): [...] dass ich mich auf das was ich höre oder wahrnehme verlassen 
kann. Dass es einen Wahrheitsgehalt hat ohne, dass ich es überprüfen muss. Ich vertraue 
der Person einfach, dass es stimmt. 00:12:40 


(Focus Group III, Pos. 54) 


Sandra (53, Technologie): [...], dass mir sozusagen der Glaube an etwas nicht zum 
Nachteil wird. 00:10:30 


(Focus Group II, Pos. 48) 


Eine Vertrauensbeziehung beruht auf der Grundannahme, dass das jeweilige Ver- 
trauensobjekt mit einer positiven und gegenüber dem Subjekt wohlwollenden Inten- 
tion handelt. Dabei muss der Inhalt der Aussage nicht notwendigerweise wahr sein 
und damit auch nicht zwingend die Meinung der Subjekte bestätigt werden, relevant 
ist die wohlwollende Intention, mit der die Information übermittelt wird. 


Tom (32, Durchschnitt): Dass der Gegenüber [sic!] im besten Interesse von einem 
selber für einen handelt [...] 00:07:03 


(Focus Group I, Pos. 22) 


Noah (34, Medien): [...] ich [kann] selbst dann großes Vertrauen in eine Person haben 
[...], wenn jemand nicht immer die Wahrheit sagt oder nicht immer aufrichtig zu mir 
ist. [...] ich sage, das ist schon ok und es steckt aber eine gute Intention dahinter. Die 
Person will mir nichts Böses. 00:14:35 


(Focus Group III, Pos. 58) 


Im weiteren Gespräch vertiefen zwei Teilnehmende außerdem die Frage, ob Ver- 
trauen entstehen kann, wenn die Aussagen den Vertrauensobjekts nicht mit der 
eigenen Meinung übereinstimmen. 
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Wilfried (45, Technologie): Ja, ich würde das sogar entkoppeln von dem ‚ich-bin- 
deren-Meinung‘ oder ‚es bestätigt meine Meinung‘. Ich würde sogar sagen, dass es 
durchaus Leute gibt, denen ich vertrauen kann, aber deren Meinung ich überhaupt nicht 
teile. Oder die anderer Meinung sind, trotzdem glaubwürdig deswegen sind. Also das 
hat mit dem Inhalt selbst oder meiner Bewertung des Inhalts erstmal wenig zu tun. 
00:11:09 


Wilfried (45, Technologie): Eher, dass ich einfach tatsächlich ein Vertrauensverhältnis 
habe, im Sinne von ich glaube, dass das, was derjenige sagt, auch dem entspricht, was 
derjenige wirklich überzeugt denkt. [...] Dass mich die Person einfach nicht bewusst 
anlügen will. 00:11:43 


(Focus Group II, Pos. 53, 55) 


Vertrauen beruht auf bisherigen Erfahrungen, die die Teilnehmenden im Umgang 
mit den jeweiligen Vertrauensobjekten oder in ähnlichen Situationen gesammelt 
und wahrgenommen haben. Angesprochen wird eine ‚Ur-Gelassenheit‘ oder ein 
Vertrauensvorschuss, der mit einer Vertrauensbewertung einhergeht. 


Maxim (30, Medien): [...] Zusätzlich [...] gehört für mich noch eine Ur-Gelassenheit 
dazu. Also das Gefühl, dass alles gut werden wird. [...] Ein Vertrauensvorschuss, 
den man aus bisherigen Erfahrungen gemacht hat. Man hat mehrfach die Erfahrung 
gemacht, dass etwa für einen gut oder positiv ist. [...] 00:13:57 


(Focus Group III, Pos. 57) 


Insgesamt entsprechen die Ergebnisse zum interpersonalen Vertrauen den bisheri- 
gen Erkenntnissen zur Definition des allgemeinen Vertrauensbegriffs: Vertrauen ist 
eine Beziehung aus mindestens zwei beteiligten Akteur:innen. Eine Vertrauensent- 
scheidung beruht auf einer aktiven Handlung, die mit Unsicherheit verbunden und 
auf zukünftiges Handeln gerichtet ist. Vertrauen ist ein langfristiges Konstrukt und 
beruht unter anderem auf den Erfahrungen des Vertrauenssubjekts im Umgang mit 
dem Vertrauensobjekt. Vertrauen und Glaubwürdigkeit sind eng verknüpfte Kon- 
zepte und werden - in der Theorie und in der Empirie — häufig synonym verwendet. 


8.2.2 Vertrauen in Journalismus 


Grundsätzlich schreiben die Teilnehmenden Journalismus in Deutschland — auch 
im internationalen Vergleich — mittlere bis hohe Vertrauenswerte zu. Dazu beziehen 
sich Einzelne auch auf externe Beurteilungskriterien, wie z.B. weltweite Rankings 
zur Pressefreiheit. 
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Maxim (30, Medien): [...] Ich habe auch das Gefühl, dass man Journalismus in 
Deutschland schon recht gut vertrauen kann. Dazu gibt es auch diese Rankings von 
angeblich unabhängiger Stelle, wie ‚Reporter ohne Grenzen‘ die das feststellen [...] 
00:20:58 


(Focus Group III, Pos. 72) 


Die hohen Vertrauenswerte führen aber nicht dazu, dass Journalismus unreflektiert 
oder wenig kritisch betrachtet wird. 


Tom (32, Durchschnitt): Also früher hieß es ja seriöse Quellen und Belege und mög- 
lichst unvoreingenommen einen Sachverhalt möglichst komplett beleuchten. Das ist 
mittlerweile [...], zumindest für mich, in weite Ferne gerückt, dieser Ursprung des 
Journalismus. 00:11:27 


Max (29, Durchschnitt): Auch weil sich viele Artikel, also von Zeitung zu Zeitung 
zum selben Thema einfach unterscheiden und jeder was anderes schreibt. Das macht 
es natürlich schwierig, das zu glauben. 00:11:36 


(Focus Group I, Pos. 36-37) 


Die Teilnehmenden sprechen von einer Idealvorstellung des Journalismus, die sie 
prägt. Diese Vorstellung bezieht sich auf die Funktionsweise des Journalismus als 
Ganzes oder die Arbeitsweise journalistischer Akteur:innen und häufig wird auf die 
Integrität der Journalist:innen verwiesen, die wahrheitsgemäß und ohne Beeinflus- 
sung berichten. 


Jan (32, Medien): [...] Dass sich die Leute [journalistische Akteur:innen] [...] nicht 
beeinflussen lassen und die wirkliche unverfälschte Nachricht bringen. Dass sie inte- 
ger sind und das berichten, was Wahrheit ist, was sie wahrnehmen. Und dass keine 
Lobbyaspekte oder derartiges mit in die Berichterstattung einfließen. 00:15:35 


(Focus Group III, Pos. 66) 
Elfriede (72, Durchschnitt): [...] Dass man sich einfach darauf verlassen kann, dass 
das, was berichtet, wird auch stimmt. 00:07:47 


Christine (49, Durchschnitt): [...] vielleicht eine naive Vorstellung von diesem 
unglaublich integeren, recherchierenden Journalisten, der vor nichts mehr Angst hat 
und nur die Wahrheit herausfinden will. Dass da wirklich ein Mensch dahintersteht, 
der es genau wissen wollte. Und das, was er oder sie in Erfahrung gebracht hat, [...] 
dann so berichtet, wie es sich zugetragen hat. 00:08:59 


(Focus Group I, Pos. 27, 31) 


Als Konsequenz von Vertrauen hinterfragen die Lesenden journalistische Produkte 
seltener und sind weniger kritisch in der Rezeption. 
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Noah (34, Medien): [...] In anderen Ländern hinterfrage ich die Berichterstattung viel 
häufiger und deutlich schneller als in Deutschland. 00:17:36 


(Focus Group III, Pos. 69) 


Außerdem beschreiben die Teilnehmenden verschiedene journalistische Objekte, 
auf die sich das Vertrauen der Lesenden bezieht. Genannt werden sowohl spezifische 
Vertrauensobjekte, wie journalistische Akteur:innen, einzelne Medien und deren 
Publikationen sowie Online-Publikationen und Bloggerjournalist:innen. Zudem 
thematisierten die Teilnehmenden ‚Journalismus als Ganzes‘ und ‚die etablierten 
Medien‘ als generalisierte Bezugsobjekte des Journalismusvertrauens. 

Als Kriterien für die konkrete Prüfung der Vertrauenswürdigkeit von Journalis- 
mus werden eine Reihe verschiedener Merkmale genannt. Am häufigsten genannt 
und mit dem größten Einfluss auf die Vertrauensbewertung beschrieben wird die 
wahrgenommene bewusste Manipulation der Lesenden. Wenn Lesende eine gezielte 
Manipulation wahrnehmen, dann sinkt die Vertrauenswürdigkeit von Journalismus 
im Allgemeinen beziehungsweise das Vertrauen in die einzelne Nachricht und die 
jeweilige Medienorganisation, und zudem wird das Ansehen von Journalist:innen 
nachhaltig geschädigt. Als bewusste Manipulationsstrategien beschreiben die Teil- 
nehmenden unwahre Tatsachenbehauptungen, die Verzerrung von Informationen, 
die einseitige Darstellung von Meinungen oder Sachinformationen sowie das Weg- 
lassen relevanter Aspekte oder Akteur:innen. 


Viktoria (42, Technologie): [...] Ich habe das Gefühl, dass es [...] keine neutrale 
Berichterstattung [gibt]. Du bringst ganz schnell, einfach allein durch die Tatsache, 
wie du einen Satz formulierst, wen du nach vorne stellst, wer auf dem Foto drauf ist, 
ob die lächeln oder nicht, ecetera. Du transportierst da schon so viel Inhalt, dass du 
gar nicht mehr sagen kannst, dass das irgendwie neutral berichtet ist. [...] das senkt 
[...] das Vertrauen ein Stück weit, weil du dich immer fragst, was sie denn jetzt gerade 
vorhaben, in welche Richtung versuchen sie mich vielleicht gerade irgendwo hin zu 
schubsen [...] 00:21:41 


Sandra (53, Technologie): Ich hätte dazu noch einen anderen Blickwinkel auf unsere 
Vergangenheit [Anm.: ehrenamtliches politisches Engagement in der Piratenpartei], 
und zwar so Themen, die wir selbst miterlebt haben [...] Parteitage, Demonstratio- 
nen [...]. Ich meine klar, du hast halt immer deine subjektive Sicht auf irgendwelche 
Ereignisse, über die potentiell berichtet wird. Wenn du aber siehst, was davon in den 
Medien ankommt, und du denkst, das muss eine andere Veranstaltung gewesen sein 
und nicht die, auf der ich war (Pause). Oder der Moment, wo uns zum ersten Mal 
bewusst aufgefallen ist, bei irgendwelchen Demonstrationen, wo wir genau wussten, 
dass wahnsinnig viele Piraten-Flaggen in der Menschenmenge waren und in der Tages- 
schau hast du keine einzige gesehen. [...] Ich halte die Tagesschau für ein durchaus 
seriöses Medium, aber das waren die Momente, wo ich mir dachte: Irgendwas läuft 
hier schief. 00:16:33 
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Sandra (53, Technologie): Nein, das hat mein Vertrauen nicht unbedingt geändert [...] 
Aber es hat meinen Blick geändert, auf, wie ich Medien wahrnehme [...] ich frage mich 
dann immer, was ist denn die Intention von denen in der Redaktion, die entscheiden, 
dass das die jetzt so viel Sendezeit bekommen oder halt eben null Sendezeit oder dass 
bewusst Sachen rausgestrichen werden. 00:19:23 


(Focus Group II, Pos. 79, 67, 74) 


Neben der, das Vertrauen schwächenden bewussten, Manipulation werden auch Kri- 
terien ausgemacht, die das Vertrauen in Journalismus stärken. Sie können nach ihrem 
jeweiligen Bezugsobjekt gruppiert werden: Vertrauen in Journalismus machen die 
Teilnehmenden an der Einhaltung normativer journalistischer Standards fest, wie 
z.B. eine ausgewogene und sorgfältige Recherche, die berufsethische Verpflichtung 
zur wahrheitsgemäßen Berichterstattung, die differenzierte Darstellung unterschied- 
licher gesellschaftspolitischer Standpunkte und Meinungen, ein faires Abwägen 
verschiedener Standpunkte in einem Text und die Aufbereitung von Informationen 
in der Art, dass Lesende eine eigene Meinungsbildung vollziehen können. Jour- 
nalismus gilt unter den Teilnehmenden als glaub- und vertrauenswürdig, wenn die 
Intention und der Standpunkt der beteiligten journalistischen Akteure transparent 
sind. Damit ist gemeint, dass beispielsweise politische Standpunkte nachvollziehbar 
sind. 


Michael (39, Technologie): [...] Für mich ist es die offene Absicht. Also wenn ich weiß, 
bestimmte Personen, bestimmte Seite, bestimmter Verlag [...] berichtet tendenziös und 
man weiß es, dann kann man sich darauf einstellen. [...] Und abwägen was kann da 
vielleicht passen, was auch nicht. Wie immer liegt die Wahrheit irgendwo dazwischen. 
Das ist für mich dann Vertrauen, also eine offene Absicht. 00:13:37 


Wilfried (45, Technologie): [...] Man muss es halt bewerten können, wo es herkommt. 
Ich finde ja auch auf der linken Seite nicht alles objektiv berichtet, auch da sind ja 
durchaus Kolorierung drin, die das färben wollen, aber das muss nicht unbedingt mein 
Vertrauen mindern, wenn ich es weiß. [...] 00:15:20 


(Focus Group II, Pos. 60, 63) 


Außerdem genießen Nachrichten einen Vertrauensvorschuss, wenn die Publikation 
bei den Lesenden als glaubwürdig angesehen wird. Werden Sachverhalte in ver- 
schiedenen Zeitungen, zwar mit einer unterschiedlichen Tonalität, aber doch ähnlich 
beschrieben, dann steigt das Vertrauen in die jeweilige Nachricht. 


Noah (34, Medien): [...] Aber solange sich die Tatsachen einigermaßen decken über 
das gesamte Spektrum, kann ich drauf vertrauen. 00:19:04 


(Focus Group III, Pos. 71) 
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Max (29, Durchschnitt): Auch weil sich viele Artikel also von Zeitung zu Zeitung 
zum selben Thema einfach unterscheiden und jeder was anderes schreibt. Das macht 
es natürlich auch schwierig, das zu glauben. 00:11:36 


(Focus Group I, Pos. 37) 


Außerdem werden im Text angegebene weiterführende Quellen und Hintergrundin- 
formationen als vertrauensbildend beschrieben. Negativ beeinflusst wird die wahr- 
genommene Vertrauenswürdigkeit eines Nachrichtentextes, wenn grammatikali- 
sche oder orthografische Fehler und inhaltliche Widersprüche im Text auffallen. 


Christine (49, Durchschnitt): [...] wenn ich das Gefühl habe, dass in dem Geschriebe- 
nen meine Meinung manipuliert werden soll, dann höre ich auf zu lesen. Also Wider- 
sprüche, schlechter Satzbau und Manipulation das sind die drei Kriterien [Anm.: für 
sinkendes Vertrauen]. 00:10:49 


(Focus Group I, Pos. 34) 


Eine Teilnehmerin spricht zudem die Vertrauenswürdigkeit des Mediensystems an. 
Für sie ist ein Mediensystem vertrauenswürdig, wenn gesellschaftliche Minderhei- 
ten und unterrepräsentierte Gruppen in der Berichterstattung Gehör finden, eine 
offene Fehlerkultur herrscht und Kontrollinstanzen zur Wahrung der Ausgewogen- 
heit existieren. 


Maxim (30, Medien): [...] Ich glaube, dass eine Demokratie davon lebt, dass es bei 
Medien auch gewisse Kontrollinstanzen gibt, die dafür sorgen, dass eine Ausgewogen- 
heit da sein soll. Instanzen beispielsweise, die Mahnungen oder Rügen und Ähnliches 
verteilen. Das gehört für mich zum Vertrauensverhältnis in Journalismus auch dazu. 
00:20:58 


(Focus Group III, Pos. 72) 


Damit bestätigen die empirischen Ergebnisse die in theoretischen Auseinander- 
setzungen mit der Vertrauensforschung beschriebenen Grundannahmen: Lesende 
haben eine geteilte Vorstellung über die Aufgaben und Funktionen von Journalismus 
und der beteiligten Akteur:innen, wenngleich sie nicht im Detail jeden Schritt der 
Nachrichtenproduktion kennen. Zusätzlich haben Teilnehmende neben dem spezi- 
fischen Medienvertrauen auch einen generalisierten Vertrauensbegriff beschrieben. 
Deutlich wird außerdem, dass die Begriffe Vertrauen, Glaubwürdigkeit und Qualität 
überlappend und teilweise synonym verwendet werden. 

Zudem führen die mittleren bis hohen Vertrauensniveaus, die die Teilnehmenden 
in der Rekrutierung und in den Focus Groups angeben, nicht dazu, dass Journalis- 
mus unkritisch und unreflektiert betrachtet wird. Im Gegenteil, für Probleme im 
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Journalismus, die die Lesenden wahrnehmen, suchen sie neue Handlungsoptionen 
auf individueller Ebene: Einige Teilnehmende berichten beispielsweise, dass die 
Berichterstattung rund um die Verbreitung des Coronavirus und solche über die 
Demonstrationen gegen politische Maßnahmen Zweifel an einer neutralen Bericht- 
erstattung erzeugt haben. Infolgedessen suchen sie aktiv nach Informationen aus 
unterschiedlichen Quellen und Publikationen und fordern verstärkt, dass Kommu- 
nikator:innen Hintergrundinformationen zu ihrer Person und zu den verwendeten 
Informationen angeben. 

Abschließend sprechen einige Teilnehmende bereits in der Definition von Ver- 
trauen in Journalismus die Frage an, ob und wenn ja welche journalistischen Funk- 
tionen unbedingt durch menschliche Akteure und menschliche Fähigkeiten erfüllt 
werden müssen. 


Christine (49, Durchschnitt): [...] Dass da wirklich ein Mensch dahintersteht, der es 
genau wissen wollte. [...] Also es ist schon in erster Linie ein Mensch, der das [Anm.: 
Journalismus] macht. 00:08:59 


(Focus Group I, Pos. 31) 
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Im folgenden Abschnitt wird die Wahrnehmung des automatisierten Journalismus 
durch das Publikum thematisiert. Dazu wird zunächst aufgeführt, wie die Teilneh- 
menden den Gegenstand und die Funktionsweise beschreiben, welche Vorstellungen 
sie von der Technologie und den Einsatzmöglichkeiten haben und wie sie Chancen 
und Grenzen der automatisierten Berichterstattung wahrnehmen. Außerdem wird im 
zweiten Abschnitt aufgeschlüsselt, wie die Teilnehmenden die Veränderungen des 
Journalismus insgesamt durch die Existenz der automatisierten Berichterstattung 
bewerten. Dazu wird erhoben, wie sie die Relevanz und Auswirkungen des auto- 
matisierten Journalismus beschreiben und bewerten und welche Gefühle — sowohl 
positive als auch negative — gegenüber dem Untersuchungsgegenstand artikuliert 
werden. 


8.3.1 Beschreibung des Untersuchungsgegenstand 
Automatisierten Journalismus beschreiben die Teilnehmenden im Laufe der Gesprä- 


che der Focus Groups als Möglichkeit, mit regelbasierten oder KI-Algorithmen 
einfache standardisierte Texte im Journalismus zu erzeugen. Zur Benennung der 
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Verfahren verwenden sie Begriffe wie Roboternews, Bots, Textgeneratoren oder 
Künstliche Intelligenzen®. Beim Vergleich zwischen klassischem Journalismus und 
automatisiertem Journalismus schreiben die Teilnehmenden beiden Textquellen 
unterschiedliche Eigenschaften zu, zum Beispiel: 


Paul (35, Technologie): [...] die Maschine präsentiert die Fakten. Und der Mensch 
bringt dann noch eine witzige Note mit rein, um den Artikel für einen Menschen 
interessanter zu machen. [...] 01:11:15 


(Focus Group II, Pos. 323) 


Ein bekanntes Einsatzgebiet des automatisierten Journalismus ist die Sportbericht- 
erstattung. Die Teilnehmenden vermuten, dass weitere einfache Routinetexte wie 
Wetterberichte automatisiert erzeugt werden können. Insbesondere hinsichtlich der 
Verbreitung sowie der technologischen Funktionsweise und der tatsächlichen Nut- 
zung von Algorithmen, die mit Künstlicher Intelligenz arbeiten, äußern die Teilneh- 
menden ein hohes Informationsbedürfnis (vgl. ausführlich Abschnitt 8.4.4). 


Max (29, Durchschnitt): Ich kenne so Texte aus Sportberichten, wie Fußballspiele 
zum Beispiel. Und wenn das automatisch geschrieben worden ist, dann sind immer 
die gleichen Phrasen drin. So, 2:1 das Ende und das knappste aller Ergebnisse steht 
dann immer dort. 00:15:54 

(Focus Group I, Pos. 52) 

Sandra (53, Technologie): Ja, da [Anm.: Sportberichte] könnte ich mir tatsächlich 
vorstellen, dass das gut funktioniert. Weil es eine Aufbereitung von Zahlen zu einem 
Text ist. Das Gleiche kannst du wahrscheinlich auch mit Wetterdaten und anderen 
Sachen machen. Also da, wo man einen Text um Zahlen rumstricken muss und es soll 


einigermaßen nett klingen und das Lesen erleichtern — im Gegensatz zu einer Tabelle 
mit Zahlen. 00:26:03 


(Focus Group II, Pos. 93) 


Zur Beschreibung der Verfahren werden immer wieder Formulierungen wie ‚ein 
wenig Text um Zahlen herum‘, ‚einfache Aufbereitung von Zahlen‘, ‚ausformulierte 
Excelliste‘ oder ‚Zahlenprosa‘ verwendet. 


3 Bereits in der Beschreibung des automatisierten Journalismus wird deutlich, dass ein Infor- 
mationsbedarf über den tatsächlichen Einsatz von Verfahren der Künstlichen Intelligenz zur 
automatisierten Textgenerierung im Journalismus besteht. Die Vorstellungen über Künstliche 
Intelligenzen prägen die Vermutungen der Teilnehmenden über Chancen und Grenzen des 
automatisierten Journalismus. Dies wird im weiteren Verlauf und erneut in Abschnitt 8.6.4 
thematisiert. 
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Wilfried (45, Technologie): [...] Ein wenig Text um Zahlen herum gebaut. 00:48:20 


Sandra (53, Technologie): Ja, oder auch mit den Fußballergebnissen. Also eine Auf- 
bereitung von Zahlen. 00:48:25 


(Focus Group II, Pos. 201-202) 


Mehrheitlich geben die Teilnehmenden an, dass sie zwar grundsätzlich von der Exis- 
tenz der automatisierten Berichterstattung gehört, aber noch nicht bewusst automa- 
tisiert generierte Nachrichten rezipiert haben. 


Wilfried (45, Technologie): [...] Ich bilde mir ein, dass ich noch nie bewusst selber 
eine bekommen hätte, aber vielleicht war sie auch nur zu gut [...] 00:02:10 


(Focus Group II, Pos. 15) 


Drei Teilnehmende berichten über konkrete Erfahrungen mit automatisiertem Jour- 
nalismus: Zwei Teilnehmer sprechen über automatisierte Fußballberichte und eine 
Teilnehmerin beschreibt personalisierte Newsfeeds, bei denen sie Roboternews ver- 
mutet, da die Texte häufig gleich strukturiert sind. 


Anne (32, Durchschnitt): [...] wenn ich aus Versehen nach links in meinem Handy 
wische und dann kommen Google News. [...] Dann klickt man eins an und dann wird 
einem zu dem Thema immer wieder was angezeigt, das sind verschiedene Zeitschriften 
oder Online-Magazine und die schreiben (...) das Gleiche. [...] Das wird ja auch oft 
von Robotern schon geschrieben. 00:01:28 


(Focus Group I, Pos. 8) 


Im Anschluss an die Besprechung der Praxisbeispiele (vgl. Leitfaden in 
Abschnitt 7.2) weist zudem ein Teilnehmer darauf hin, bereits automatisiert gene- 
rierte Texte gelesen zu haben, was ihm bis dato nicht bewusst war. 


Noah (34, Medien): [...] jetzt, wo ich diesen Artikel [Anm.: Praxisbeispiel] sehe, weiß 
ich, dass ich solche Artikel schon relativ häufig gelesen habe. [...] 00:43:51 


(Focus Group III, Pos. 128) 


Über die Funktionsweise des automatisierten Journalismus und die technologi- 
schen Hintergründe ist mehrheitlich kaum Konkretes bekannt. Die Teilnehmen- 
den sprechen daher insgesamt ein hohes Informationsbedürfnis an (vgl. ausführlich 
Abschnitt 8.4.4). Die Vorstellung über die Funktionsweise dominieren zwei unter- 
schiedliche Perspektiven zu den vermuteten technologischen Möglichkeiten der 
Textgenerierung: Zunächst sprechen die Teilnehmenden von einfachen und stan- 
dardisierten Routinetexten. Diese basieren, so die Vorstellung, zum Beispiel auf 
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menschlich verfassten Lückentexten, wobei tagesaktuell ausgewählte Datensätze 
aktualisiert werden. Bei einigen Teilnehmenden sind gleichzeitig vage Vorstellun- 
gen über Algorithmen oder Künstliche Intelligenzen präsent, die auch elaborierte 
journalistische Texte generieren können. Wiederholt haben einige Teilnehmende 
beide Perspektiven geäußert: 


Anne (32, Durchschnitt): [...] Also ich stelle mir [...] eine Exceltabelle vor, da kann 
man Zahlen auswechseln oder das macht der Computer selber und dann wird der Text 
danach verfasst. [...] 00:26:57 


Anne (32, Durchschnitt): [...] Ich glaube, dass die [Anm.: Algorithmen] da [...] Stich- 
punkte kriegen oder sich das irgendwo herziehen und die formulieren das dann selber. 
Die können das. Bei meinem Firmencomputer [...] wenn ich da anfange, eine Nach- 
richt zu tippen, wird die automatisch vervollständigt. [...] letztendlich könnte der ja 
den Text irgendwie doch selber schreiben. Keine Ahnung, wie genau das funktioniert, 
aber ich glaube, die ziehen nur bestimmte Infos und schreiben dann wirklich selber. 
Die müssen einen Schreibstil haben oder so. 00:21:35 


(Focus Group I, Pos. 95, 74) 


Bis auf zwei Ausnahmen sprechen die Teilnehmenden keine genaueren Vorstel- 
lungen der technologischen Funktionsweise der Textgenerierungsalgorithmen, den 
Daten- oder Modellgrundlagen an. Die Vorstellung, dass automatisierter Journalis- 
mus mit Künstlichen Intelligenzen arbeitet, wird insbesondere in der Gruppe der 
Technologie- und Medienreflektierten thematisiert. 


Michael (39, Technologie): Wo ich weiß, dass es bereits zum Einsatz kommt, sind 
Fußballergebnisse [...]. Da wird aufgezeichnet, was während des Turniers passiert ist, 
und hinterher kommt eine KI oder ein Textgenerator, also etwas echt Programmiertes, 
und baut daraus einfach einen Text. Da sind vielleicht ein paar Adjektive drin, so 
wunderbares Tor [...] ich mein’ der Mensch macht es nicht anders. Oder du kannst das 
Ding so trainieren, dass es [...] die Adjektive weglässt und das Ding ist sehr neutral 
[...] So 3 zu 1 ging es aus, und A, B und C sind die Torschützen. Tolles Spiel und 5000 
Zuschauer Ende. 00:25:39 


Michael (39, Technologie): [...] ich kenne die verschiedenen Varianten, die es da gibt 
[...], so Reinforcements Learning und so [...]. Wenn du [...] eine Story haben willst 
über irgendein bestimmtes Thema, dann schreibt dir die Kl einfach das Teil. Das ist 
kein Hexenwerk in dem Sinne. [...] 00:06:56 


(Focus Group II, Pos. 92, 32) 


Als Vorteile der automatisierten Berichterstattung beschreiben die Teilnehmenden 
die Schnelligkeit, die Aktualität und die Genauigkeit der Berichte und möglicher- 
weise eine höhere Objektivität der Texte. 
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Anne (32, Durchschnitt): Geschwindigkeit. Es ist ja so viel schneller. [...] der Artikel 
[ist] innerhalb von wahrscheinlich ein paar Sekunden fertig, weil ihn keiner schreiben 
muss, sondern dieser Roboter den hinklatscht [...] da kann ja viel mehr erreicht werden 
und viel schneller. 00:05:12 


Tom (32, Durchschnitt): Aber [...] ist es [...] nicht sogar ein Vorteil, wenn man den 
von Maschinen geschriebenen Journalismus nimmt? Dass der von Grund auf weniger 
biased oder positionsbezogen ist, weil der Mensch immer irgendwie trotzdem nie 
hundert Prozent objektiv sein kann. 00:14:03 


(Focus Group I, Pos. 16, 42) 


Im Gespräch befürworteten sie die automatisierten Texte zudem in weniger hoch- 
wertig wahrgenommenen Ressorts, zum Beispiel in der Boulevardberichterstattung. 
Bei diesen Themen sei es sinnvoll keine menschlichen Ressourcen aufzuwenden. 


Alina (30, Medien): Sinnvoll auf jeden Fall (-) 01:06:30 


Jan (32, Medien): Da [Anm.: Boulevardberichterstattung] nicht mehr Ressourcen 
darauf zu verwenden [...] 01:06:32 


(Focus Group III, Pos. 201-202) 


Die Grenzen der automatisierten Berichterstattung liegen nach Wahrnehmung der 
Teilnehmenden in der Einordnung von Fakten und Hintergründen sowie dem Abwä- 
gen von Argumenten in einem Text. Für komplexere Zusammenhänge, wie etwa 
wissenschaftlich fundierte Nachrichten oder hochspezialisierte Texte, sind compu- 
tergenerierte Nachrichten mutmaßlich nicht geeignet. Insbesondere, wenn Verfah- 
ren der Künstlichen Intelligenz verwendet werden, können sich die Teilnehmen- 
den vorstellen, dass automatisiert generierte Texte zwar eine schöne Sprache, aber 
denkbar fragwürdige Inhalte haben. Außerdem sehen die Teilnehmenden automa- 
tisierten Journalismus als nicht geeignet für sensible und werteorientierte Bericht- 
erstattung an und nennen dazu als Beispiel Kriegsberichterstattung. Abschließend 
weisen insbesondere medienkompetente Teilnehmende auf mögliche Probleme im 
Journalismus hin, wenn Nachrichten automatisiert veröffentlicht werden und keine 
Folgeabschätzung von Veröffentlichungen erfolgt (vgl. ausführliche Darstellung 
von positiven und negativen Erwartungen in Abschnitt 8.4). 


Daria (32, Medien): [...] Ich kann es mir auch nur bei einfachen Sachen vorstellen, 
wie etwa Spielberichten. [...] Nicht vorstellen kann ich es mir zum Beispiel bei einer 
Reportage, bei der die Sprache nicht festgelegt ist. 00:11:51 


(Focus Group III, Pos. 48) 


Sandra (53, Technologie): Problematisch wird es dann wahrscheinlich bei einem 
Text, wo es nicht um Zahlen geht. Also nicht unbedingt Lyrik, weil da hast du viel 
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kreative Freiheit. Sondern einen Zeitungsartikel, wo du keine objektiven Kriterien hast, 
an denen sich der Bot langhangeln kann, um den Text zu bauen, sondern der einfach 
Wörter aus dem Kontext irgendwie (...). Du gibst dem 73 Wörter und Begriffe und 
[...] dann kannst du vielleicht noch sagen, du willst einen fröhlichen Text oder einen 
traurigen Text und dann fängt das Gerät an, vor sich hin zu rattern. Und ich glaube da 
liegt das Risiko, dass du Texte bekommst, die vielleicht gut klingen, aber vielleicht 
inhaltlich fragwürdig sind. 00:27:02 


(Focus Group II, Pos. 95) 


Insgesamt verändern sich die Beschreibung der Teilnehmenden über die Verfah- 
ren des automatisierten Journalismus und die Vermutungen über die Technologie 
und die Einsatzmöglichkeiten im Laufe der Gespräche der Focus Groups wenig. 
Die Vorstellungen und Wahrnehmungen der Teilnehmenden über automatisierten 
Journalismus bleiben nahezu gleich. Allerdings gibt die große Mehrheit der Teil- 
nehmenden am Ende der Gespräche und nach dem intensiven Austausch an, dass 
sich ihre Erwartungen an eine werteorientierte Verwendung des automatisierten 
Journalismus erhöht und zudem ihr Informationsbedürfnis steigt. Dies wird im Fol- 
geabschnitt besprochen. 


8.3.2 Bewertung der Veränderungen im Journalismus 


Die Teilnehmenden sehen automatisierten Journalismus als relevante Medienin- 
novation im Journalismus an. Mit automatisierter Kommunikation verbinden sie 
zunächst negativ konnotierte Begriffe. Insbesondere die Einordnung und Bewer- 
tung von Sachverhalten durch Algorithmen ohne weitere menschliche Kontrolle 
und Prüfung bewerten die Teilnehmenden als kritisch. Insgesamt werden Neugierde 
und Faszination, aber auch Angst und Skepsis gegenüber dem Technologieeinsatz 
im Journalismus angesprochen. Diese Punkte werden im Folgenden ausführlich 
dargelegt. 

In den Gesprächseinstiegen der Focus Groups und in den initialen Äußerungen 
der Teilnehmenden zum automatisierten Journalismus wird die Medieninnovation 
zunächst eng mit negativ konnotierten Begriffen verbunden: Die Teilnehmenden 
sprechen bei automatisierter Kommunikation im Journalismus zunächst über Wahl- 
beeinflussung und Manipulation von öffentlicher Meinung und nennen als Beispiel 
ihre Wahrnehmung des Präsidentschaftswahlkampfs von Donald Trump 2020*. 


4 In einer ersten Version des Leitfadens wurden die Eisbrecher- und Einstiegsfragen mit Bezug 
zur Berichterstattung um die Präsidentschaftswahl oder die öffentliche Diskussion um russi- 
sche Botarmeen eingeleitet. Diese wurden nach einem Pretest des Leitfadens aber entfernt. 
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Im weiteren Gesprächsverlauf bewerten die Teilnehmenden automatisierten 
Journalismus als ein interessantes neues technologisches Phänomen im Journalis- 
mus. Als relevante Medieninnovation wird automatisierter Journalismus insbeson- 
dere dann bezeichnet, wenn die Teilnehmenden vor der Erhebung keine oder sehr 
wenig Kenntnis über die Existenz des automatisierten Journalismus angeben haben. 


Maxim (30, Medien): [...] für mich ist das [Anm.: automatisierter Journalismus] eine 
krasse Neuerung [...] 00:42:40 


(Focus Group III, Pos. 127) 


Tom (32, Durchschnitt): [...] Ich finde das Thema, jetzt wo wir darüber gequatscht 
haben, sehr wichtig und schon interessant. 01:16:44 


I: [...] warum wichtig? 01:16:46 


Tom (32, Durchschnitt): Weil es weiß eben [...] große Auswirkungen haben kann auf 
die komplette Gesellschaft, je nachdem wie es eingesetzt wird. 01:16:57 


(Focus Group I, Pos. 243-245) 


Die in den Focus Groups vorgelegten Anwendungs- und Praxisbeispiele der auto- 
matisierten Berichterstattung beschreiben die Teilnehmenden insgesamt als eher 
langweilig und verweisen für mögliche interessantere Entwicklungen auf den künf- 
tigen Einsatz von Verfahren der Künstlichen Intelligenz. Besonders enttäuscht über 
die mangelnde Finesse und Komplexität der vorgelegten Praxisbeispiele äußern sich 
technologieaffine Teilnehmende und solche, die Erfahrungen mit automatisiertem 
Journalismus angeben, die sie vor der Erhebung gemacht haben. 

Sowohl im Umgang mit Anwendungsbeispielen als auch in der Reflexion der 
Auswirkungen der Medieninnovation bewerten alle Teilnehmenden die wahrge- 
nommene Qualität automatisiert generierter Nachrichten kritisch und können sich 
nicht vorstellen, dass die Verfahren geeignet sind, um hochwertige Texte, komplexe 
Themen oder meinungsbildende Darstellungsformen zu generieren. 


Wilfried (45, Technologie): Keine qualitativ hochwertigen [Anm.: Texte] hätte ich 
bis jetzt mitbekommen (Pause) 00:02:23 


(Focus Group II, Pos. 19) 


Als negativ beschreiben die Teilnehmenden die Tatsache, dass automatisiert gene- 
rierte Texte insgesamt wenig oder wenig deutlich als solche gekennzeichnet sind, 
sie wenig über die zugrundeliegenden technologischen Verfahren und Entstehung 


Die Teilnehmenden haben in den Focus Groups ohne gezielten Input der Interviewerin über 
den Vorwurf der Manipulation öffentlicher Meinung durch Bots gesprochen. 
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automatisierter Berichte sowie mögliche Kontrollmechanismen im automatisierten 
Journalismus wissen (vgl. Abschnitte 8.4.4 und 8.4.5). Gegenüber den gesellschaft- 
lichen Auswirkungen von automatisiertem Journalismus äußern die Teilnehmen- 
den sowohl positive als auch negative Erwartungen. Diese werden ausführlich in 
Abschnitt 8.4 thematisiert. 

In den Focus Groups werden wiederkehrend zwei gegensätzliche Gefühle geäu- 
Bert: Zum Einen sprechen die Lesenden von einer großen Faszination, Neugierde 
und hohem Interesse gegenüber dem automatisierten Journalismus als technologi- 
scher Neuerung. Zum anderen werden wiederholt Skepsis, Angst oder vereinzelt 
auch Wut angesprochen, die sich auf den Einsatz der Technologie im Journalismus 
beziehen. 

Eine große allgemeine Neugierde äußern vor allem Teilnehmende, die bisher 
keine oder sehr wenig Erfahrung mit automatisiertem Journalismus gemacht haben. 
Faszination entsteht bei ihnen vor allem aufgrund der Tatsache, dass ein Algorithmus 
oder eine Maschine überhaupt in der Lage ist, journalistische Texte zu produzieren. 


Maxim (30, Medien): [...] jetzt [Anm.: Vorlage Praxisbeispiel] bin ich gespannt. 
00:39:15 

Noah (34, Medien): Ja, erstmal nur faszinierend. 01:16:41 

(Focus Group III, Pos. 119, 246) 


Im intensiven Austausch äußern die Teilnehmenden Neugierde und Faszination ins- 
besondere bei nicht-standardisierten Texten, wie meinungsbildenden Darstellungs- 
formen und emotionalen Themen. Die Teilnehmenden versuchen hier, die Gren- 
zen des Technologieeinsatzes auszuloten und untersuchen maschinengeschriebene 
Texte beispielsweise hinsichtlich der da sich zeigenden Kreativität und Emotiona- 
lität, Eigenschaften, die sie primär den Menschen zuschreiben. Die Teilnehmen- 
den überlegen außerdem, in welchen Bereichen sie sich eine computergenerierte 
Berichterstattung vorstellen können und wo ihrer Meinung nach keine Einsatz- 
möglichkeit für Textautomatisierungen im Journalismus besteht: Sie äußern dazu 
beispielsweise den Wunsch auszuprobieren, ob sie nicht-gekennzeichnete compu- 
tergenerierte Texte als solche identifizieren können. Zudem fragen sie nach einem 
Vergleich zwischen menschlich verfassten und computergenerierten Texten zu kom- 
plexen Themen. Insgesamt dominiert bei Teilnehmenden, die wenig oder keine 
Vorkenntnisse haben Interesse und Neugierde auf einen konkreten Umgang mit den 
Ergebnissen der Textgenerierung. 
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Noah (34, Medien): Ich fände es sehr spannend [Anm.: zu sehen], wie eine Boulevard 
oder Klatschpresse so automatisierte Texte macht. [...] Das würde mich interessieren, 
gibt es das? 01:06:09 

(Focus Group III, Pos. 198) 

Sandra (53, Technologie): Ja, das wäre interessant bei einem komplexen Thema einen 
Vergleich zu haben zwischen zwei Texten. Den einen macht die KI und den anderen ein 
menschlicher Journalist und dann kann man sehen, wie es am Ende aussieht. 01:08:08 


(Focus Group II, Pos. 306) 


Zur Einordnung der geäußerten großen Neugierde sei auch auf das Phänomen der 
sozialen Erwünschtheit bei der gewählten Interviewsituation und der Anwesenheit 
der Interviewerin hingewiesen (vgl. dazu Abschnitt 7.1). Insbesondere die hete- 
rogene Focus Group hat die Projektionsfrage, ob ihre Mitmenschen ihrer Mei- 
nung nach Interesse an computergenerierter Berichterstattung haben, eher verhal- 
ten beantwortet; nach einigem Überlegen wird die Frage schlussendlich in allen 
Focus Groups verneint. Hier deutet sich an, dass die Lesenden zwar ein starkes 
Interesse an einer transparenten Kennzeichnung computergenerierter Texte (vgl. 
Abschnitt 8.4.5) haben und eine anfängliche Faszination an einer neuen Techno- 
logie besteht, aber mittel- und langfristig insgesamt mit einem Gewöhnungseffekt 
und sinkendem Interesse der Lesenden zu rechnen ist. 


Wilfried (45, Technologie): Ja, vielleicht für die ersten 20 Minuten und dann vergessen 
sie es. 00:35:34 

Paul (35, Technologie): Ja, stimmt der Mensch ist ein Gewöhnungstier [...] 00:35:37 
(Focus Group II, 123, 124) 


Neben Faszination und Interesse für die technologischen Möglichkeiten äußern die 
Teilnehmenden aber auch Skepsis und Angst, wenn sie über Textautomatisierungen 
im Journalismus intensiv reflektieren. Angst und Skepsis begleitet die Vorstellung 
der Lesenden, dass von Menschen verfasste Texte verschwinden und sich dadurch 
aktuell wahrgenommene Probleme im Journalismus — wie fehlende Empathie, man- 
gelnde Genauigkeit oder eine nicht-wahrheitsgemäße Berichterstattung — verstär- 
ken. Große Skepsis begleitet auch die Frage nach der Transparenz und Kontrolle 
der Algorithmen zur Textgenerierungen (vgl. dazu die ausführliche Darstellung im 
Abschnitt 8.4.4). Diese negativen Gefühle beruhen zum Teil auf der Angst, durch 
Textautomatisierung manipuliert zu werden. Konkret äußert eine Teilnehmerin Wut 
über mögliche Manipulationen. Die Skepsis wird zudem verstärkt durch das Unver- 
ständnis der Lesenden über fehlenden Kennzeichnungen und den intransparenten 
Umgang mit automatisiertem Journalismus. 
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Tom (32, Durchschnitt): [...] wenn das immer mehr am Markt gewinnt und der klas- 
sische menschliche Journalismus zunehmend verschwindet. 01:11:21 


Christine (49, Durchschnitt): Hm. 01:11:22 
Tom (32, Durchschnitt): Also die Angst könnte man haben. Ich weiß jetzt nicht, ob 


ich sie [Anm.: die Angst] hier habe oder haben sollte. 01:11:28 (Focus Group I, Pos. 
228-230) 


Werden in den Focus Groups mögliche Zukunftsvisionen wie eine steigende Perso- 
nalisierung von Nachrichten oder eine insgesamt steigende Anzahl von Nachrichten 
durch eine kostengünstige Produktion besprochen, dann verstärkt sich die Skepsis 
gegenüber der Technologie und Forderungen nach einem ethischen und werteori- 
entierten Einsatz werden deutlicher artikuliert (vgl. Abschnitt 8.4.1). 


8.4 Erwartungen an automatisierten Journalismus und 
Forderungen zum Technologieeinsatz 


Insgesamt begegnen die Teilnehmenden automatisiertem Journalismus in allen drei 
Focus Groups mit großer Neugierde und Offenheit und in keiner Gruppe haben 
sich Personen komplett ablehnend gegenüber dem Untersuchungsgegenstand geäu- 
Bert. Im Gegenteil: Sie offenbaren ein hohes Informationsbedürfnis und stellen eine 
Reihe von Forderungen, die sie als Grundlage eines transparenten und verantwor- 
tungsvollen Einsatzes des automatisierten Journalismus erachten. 

Im Folgenden werden die Erwartungen an automatisierten Journalismus aufge- 
führt, die sich mehrheitlich auf einen mittel- und langfristigen Einsatz der com- 
putergenerierten Berichterstattung beziehen. Da das Vorwissen über die Existenz 
des automatisierten Journalismus und der Kontakt der Teilnehmenden mit compu- 
tergenerierten Texten bisher sehr gering sind wären initiale Erwartungen an auto- 
matisierten Journalismus vor Vorlage von konkreten Anwendungsbeispielen wenig 
aussagekräftig". 

Insgesamt äußern die Teilnehmenden keinen Zweifel daran, dass automatisierte 
Berichterstattung die Zukunft des Journalismus beeinflussen wird. Sie sind teilweise 
unsicher über mögliche Konsequenzen für die Gesellschaft, zeigen eine differen- 
zierte Sichtweise auf mittel- und langfristige Perspektiven und thematisieren sowohl 
positive als auch negative Erwartungen an den Technologieeinsatz. Zudem fordern 


5 Die geäußerten Erwartungen ergeben sich mehrheitlich erst in der tatsächlichen Begegnung 
mit automatisierten Texten und werden zur in der Darstellung der Studienergebnisse erst nach 
den Ergebnissen zur Wahrnehmung des automatisierten Journalismus besprochen. 
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sie konkrete Kennzeichnungs- und Kontrollmaßnahmen beim Einsatz von automa- 
tisiertem Journalismus. 


Paul (35, Technologie): Eine Sache hat das Gespräch hier auf jeden Fall geschafft: 
Ich werde heute Nacht nicht gut schlafen. 01:13:07 
(Focus Group II, Pos. 338) 


Elfriede (72, Durchschnitt): [...] Und trotzdem muss ein Grundvertrauen da sein, 
dass doch irgendwo immer etwas Positives rauskommt, weil einfach genug Menschen 
da sind, die daran interessiert sind. Ich hoffe, das stimmt. 01:13:30 


(Focus Group I, Pos. 235) 


8.4.1 Befürchtungen und negative Erwartungen 


Neben den positiven Erwartungen, die die Teilnehmenden mit automatisierter 
Berichterstattung verbinden, äußern sie auch eine Reihe negativer Erwartungen und 
Befürchtungen. Teilweise werden diese als diffuses, nicht-zielgerichtetes allgemei- 
nes Gefühl beschrieben, andererseits äußern sie auch spezifische und detailliert 
ausformulierte negative Erwartungen gegenüber automatisiertem Journalismus. 


Sandra (53, Technologie): Ja, aber die Auswirkungen von dem, was heute schon geht, 
sind ja schlimm. 00:47:46 


(Focus Group II, Pos. 198) 


Die technologische Möglichkeit, Nachrichtentexte automatisiert, mit hoher 
Geschwindigkeit, auf einem professionellen Niveau und über viele Kanäle hinweg 
gleichzeitig veröffentlichen zu können, löst bei den Teilnehmenden die Befürchtung 
aus, dass es für Lesende schwieriger wird Falschmeldungen, Fake News oder Dee- 
pfakes erkennen und Nachrichten verifizieren zu können. Sie sprechen die Befürch- 
tung an, dass sich Echochamber- und Filterbubble-Effekte, die sie bereits jetzt im 
Journalismus wahrnehmen, in Zukunft weiter verstärken werden, wenn persona- 
lisierte Nachrichten in hoher Anzahl zur Verfügung stehen, die bezogen auf die 
politische Meinung, das Leseniveau oder individuelle Präferenzen vorausgewählt 
und im Inhalt an diese angepasst werden. 


Christine (49, Durchschnitt): [...] das [kann] auf unsere Gesellschaft ziemlich gefähr- 
lich einwirken [...]. Und klar [...] es können auch fünf [...] Journalisten [...] aus unter- 
schiedlicher Perspektive berichten. Aber [...] dadurch, dass [...] mit dem automati- 
sierten Journalismus Informationen unheimlich schnell und über ganz viele Kanäle 
unheimlich weit verbreitet werden, können [...] unterschiedliche Realitäten [entste- 
hen]. Und je mehr ich an eine glaube und eine Maschine erkennt, dass ich genau die 
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Dinge lesen will, dann wird meine Realität immer mehr gefestigt und ich werde immer 
weniger [...] mit Toleranz auf eine andere Perspektive einzugehen. [...] 00:57:58 


(Focus Group I, Pos. 181) 
Maxim (30, Medien): [...] Was hat es für einen Mehrwert, wenn es [...] keine [...] 


möglichst objektive Berichterstattung [...] keine Wirklichkeit gibt, auf die wir uns 
einigen, sondern jeder nur noch seine Wahrnehmung weiter verstärkt? 00:57:30 


(Focus Group II, Pos. 173) 


Die möglicherweise steigende Personalisierung ist für die Teilnehmenden eine 
Chance der zielgruppengenauen Nachrichtenproduktion (vgl. Abschnitt 8.4.2), löst 
gleichzeitig aber die Befürchtung aus, dass einigen Lesenden Informationen vor- 
enthalten werden, beispielsweise indem die Algorithmen kein Interesse an oder zu 
wenig Vorbildung einzelner Lesender bei einem Nachrichtenthema annehmen. 

Die Teilnehmenden äußern außerdem mehrfach die Befürchtung, dass automa- 
tisierte Berichterstattung verwendet wird, um die Lesenden und die Öffentlichkeit 
gezielt zu manipulieren. 


Christine (49, Durchschnitt): [...] In Worten steckt unheimlich viel Macht drin und 
mit den richtigen Botschaften können Menschenmassen in Bewegung gesetzt werden. 
Richtig im Sinne von, dass es gerade den Punkt trifft. Und wenn dann diese Botschaften 
[...], wenn keiner mehr so weiß (-). Wahrscheinlich regiert schon längst eine künstliche 
Intelligenz unseren Planeten [...] 00:39:51 


(Focus Group I, Pos. 128) 


Eine weitere Befürchtung der Teilnehmenden ist, dass sich die Berichterstattung 
durch die Automatisierung und eine fehlende menschliche Kontrolle nicht mehr an 
den normativen Werten, Zielen und Aufgaben orientiert, an denen sich Journalismus 
in einer freiheitlich-demokratischen Gesellschaft — im Idealfall — orientiert. 


Max (29, Durchschnitt): [...] Wenn zum Beispiel Firma Y das Programm program- 
miert und der Chef dort ist der Meinung, dass Corona halb so wild ist. Und deshalb 
werden alle Texte locker geschrieben und man liest, dass man Corona vernachlässigen 
kann. Oder genau das Gegenteil, man weiß es dann überhaupt nicht. Wenn eine Firma, 
die das programmiert, entscheiden kann, was die allgemeine Meinung ist. Ich meine, 
Zahlen kann man sich immer drehen, wie man es braucht. 00:41:04 


(Focus Group I, Pos. 132) 


Dieser Bezug zu den normativen Werten deckt sich mit der beschriebenen Vor- 
stellung von der Integrität des Journalismus (vgl. Abschnitt 8.2.2). Die Aussage 
verdeutlicht die Angst einiger Teilnehmender, dass durch den automatisierten 
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Journalismus dessen Integrität beschädigt werden könnte, und zwar durch 
Autor:innen, die sich den Zielen der wahrheitsgemäßen Berichterstattung, der objek- 
tiven Meinungsbildung oder der klar als solcher erkennbaren politischen Willens- 
bildung nicht verpflichtet fühlen, für die vielmehr Motive wie Reichweite, Zahl 
der Klicks und Interaktionen sowie der Verkauf von Emotionen oder das Erzeugen 
von Angst im Hinblick auf das Erreichen politischer oder ökonomischer Ziele im 
Mittelpunkt stehen. 


Jan (32, Medien): [...] die Tools an sich, die können ja von jedem angewandt werden 
in jederlei Kontext. [...] 00:36:51 

Maxim (30, Medien): [...] ich denke mir gerade, dass es dann komplett willkürlich 
wird, was [Anm.: welches Thema] eine sehr große Reichweite bekommt. Und dann ist 
auch nichts mehr gewonnen, dann werden wir alle überflutet mit Informationen und 
Tweets. [...] 00:06:42 

(Focus Group III, Pos. 108, 30) 

Sandra (53, Technologie): [...] aber natürlich kann man Emotionen steuern. Und wenn 
man Emotionen steuert, dann kann man diese, vielleicht jetzt nicht im Fußballkontext, 
aber auch in anderen Bereichen Meinungen steuern. 01:12:21 

Wilfried (45, Technologie): [...] dahabe ich Angst davor, wenn es um Personalisierung 
geht. Dann wird es nämlich plötzlich hässlich, weil ich dann tatsächlich eher Schiss 
hätte. Jetzt wird mir nach dem Mund geredet oder jetzt wird es so getwistet, dass man 
mich bewusst beeinflussen will [...] 00:40:31 


(Focus Group II, Pos. 328, 148) 


Zudem haben Teilnehmende die Befürchtung angesprochen, dass sich insbesondere 
Algorithmen der Künstlichen Intelligenz nicht an dem gesellschaftlich definierten 
Wertekanon orientieren oder sich — aufgrund der verwendeten Daten oder Modelle — 
nicht orientieren können. Hier sprechen Lesende konkret die Angst vor rassistischer 
oder sexistischer Berichterstattung an. 


Paul (35, Technologie): Ja, und ich habe Angst davor [Anm.: maschinengeschriebene 
Meinungstexte]. Wie gesagt die Annika [Anm.: Tay-Bot von Microsoft] hat nach drei 
Tagen den Holocaust geleugnet und fand Hitler cool. 00:28:51 


(Focus Group II, Pos. 98) 


Noah (34, Medien): [...] Einer KI müsste man erst einmal beibringen, dass es so 
Aspekte wie Rassismus, Feminismus und so [...] gibt und dass diese berücksichtigt 
werden müssen. [...] Möglicherweise wird sich die KI viele Statistiken zu Gemüte 
führen und aus Sicht der KI könnten dabei sehr reflektierte und sehr gut darstellbare 
Aussagen rauskommen, die aber rassistisches Gedankengut enthalten, weil die Quellen 
ein Übermaß an ähnlichen oder alten Statistiken sind. [...] 00:25:26 


(Focus Group III, Pos. 79) 
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Am Rande thematisiert eine Teilnehmerin zudem die negative Erwartung, dass 
Lesende Nachrichten möglicherweise nur noch dann nutzen können, wenn sie per- 
sönliche Informationen weitergeben, aus denen der Algorithmus personalisierte 
Nachrichten entwickelt. 


Viktoria (34, Technologie): [...] es ist immer die Frage, ob das Daten sind, die du 
über dich auch weitergeben willst. Also erzähle ich beispielsweise meiner Zeitung wie 
hoch mein IQ ist (Pause). 00:42:26 


(Focus Group II, Pos. 159) 


8.4.2 Hoffnungen und positive Erwartungen 


Mit automatisiertem Journalismus verbinden die Teilnehmenden eine Reihe posi- 
tiver Erwartungen, Wünsche und Hoffnungen, die sich auf den Servicecharakter 
automatisierter Texte, neue Möglichkeiten der Berichterstattung und freiwerden- 
den Ressourcen für Journalist:innen beziehen. Die positiven Erwartungen werden 
insbesondere dann angesprochen, wenn automatisierte Berichterstattung bei fak- 
tenbasierten Routinetexten verwendet wird. Deutlich zurückhaltender werden sie 
bei meinungsbildenden Darstellungsformen — bei Texten, die Wertungen und eine 
Form der Einordnung enthalten — oder bei Verwendung von Künstlicher Intelligenz 
geäußert (vgl. Abschnitte 8.6.3 und 8.6.4). 

Konkret wird bei den positiven Erwartungen mehrfach der Servicecharakter von 
Journalismus angesprochen, der durch automatisierte Berichterstattung erhöht wer- 
den kann. Hier erwarten die Teilnehmenden - insbesondere bei kurzen faktenbasier- 
ten Routinetexten — eine Steigerung in der Aktualität, Schnelligkeit und Zuverläs- 
sigkeit der Berichterstattung. Außerdem können sich die Teilnehmenden vorstellen, 
dass einige Lesende Informationen besser aufnehmen und verstehen können, wenn 
diese statt in Tabellenform in beschreibenden Texten veröffentlicht werden. Dies 
könnte insbesondere für Börsen- und Spielergebnisse im Sport relevant sein. 


Anne (32, Durchschnitt): Das wäre dann eigentlich voll cool. 00:26:22 


Anne (32, Durchschnitt): [...] da wären wir wieder bei der Technik, die das ungemein 
vereinfacht und einfacher macht. Also das immer Up-to-date zu halten. 00:26:34 


(Focus Group I, Pos. 89, 93) 


Bezogen auf künftige Entwicklungen des automatisierten Journalismus verbinden 
einige Teilnehmende die positive Erwartung, beispielsweise durch die Möglich- 
keit der Auswertung von sehr hohen Datenmengen, neue Formen der Berichter- 
stattung zu entwickeln, die mit einer rein menschlichen Informationsverarbeitung 
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nicht möglich wären. Hier werden zum Teil positive Erwartungen formuliert, ohne 
eine konkrete Vorstellung zu verbalisieren, wie diese neuen Formen der Berichter- 
stattung konzipiert sein sollten. Konkret benannt wird die Möglichkeit, durch die 
Verarbeitung großer Datenmengen - beispielsweise mit Verfahren der Künstlichen 
Intelligenz — mehr und vielfältigere Informationsquellen in die Berichterstattung 
aufzunehmen, als dies bisher möglich ist. Hier sprechen die Teilnehmenden an, dass 
Berichterstattung aus ihrer Wahrnehmung oft zu vielen Teilen aus gleichen Quel- 
len und damit ähnlichen und beschränkten Perspektiven besteht. Durch Einsatz von 
Algorithmen in der Textgenerierung — insbesondere solcher, die mit Verfahren der 
Künstlichen Intelligenz arbeiten — könnten, so die Teilnehmenden, neue Blickwinkel 
aufgenommen werden, die bisher nicht berücksichtigt werden können. 


Christine (49, Durchschnitt): [...] dann sehe ich da auch eine ziemliche Chance, also 
wenn ein gut gefütterter Roboter [...] innerhalb kürzester Zeit Informationen abgleichen 
[kann], was uns als Menschen mit unserem Gehirn und unseren Sinnesfertigkeiten nicht 
möglich wäre. Wenn innerhalb von einem Bruchteil einer Minute tausende von Quellen 
miteinander abgeglichen sind [...] da könnte natürlich auch etwas extrem Wertvolles 
dabei rauskommen. [...] 00:20:21 


(Focus Group I, Pos. 68) 

Wilfried (45, Technologie): [...] das ist ein interessanter Punkt. Wenn die KI, die 
neue Blickwinkel schafft, die eben nicht nur DPA, Reuters und die bekannten Dienste 
aufnimmt, dann könnte das sogar interessant wirken. Oder am Ende sogar, je nachdem 


wie es gemacht ist, zu mehr Vertrauen führen. Nach dem Motto: die quatschen nicht 
nur aus einer Quelle alles nach, die recherchieren selbst. (Pause) 00:38:33 


(Focus Group II, Pos. 142) 


In den Focus Groups wird als mögliches Zukunftsszenario des automatisierten Jour- 
nalismus eine steigende Personalisierung von Nachrichtenartikeln diskutiert (vgl. 
Abschnitt 7.4). Hier sprechen Teilnehmende eine zielgruppenorientierte Nachrich- 
tenproduktion oder eine verbesserte Barrierefreiheit von personalisierten Nachrich- 
tentexten durch Leichte Sprache als Chance des automatisierten Journalismus an. 


Christine (49, Durchschnitt): [...] wenn ich unterhalten will, dann schickt mir bitte 
nur die Sachen, die mich wirklich interessieren und auch in der Einfärbung und mit 
dem Humor und Sarkasmus oder was auch immer gerade zu meiner Tagesstimmung 
oder Hormonlage passt [...]. 00:57:58 


(Focus Group I, Pos. 181) 


Maxim (30, Medien): [...] Was ich [...] gerade ganz spannend fand [...] [, dass] so ein 
Text [...] dann auch in verschiedenen Schwierigkeitsstufen abgebildet werden [kann]. 
Hier denke ich wieder an das Thema Barrierefreiheit und ich fände es ziemlich gut, 
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wenn man zumindest die Option — das wäre wichtig — hätte, das zu nutzen. [...] Das wäre 
super für Menschen mit einer leichten Lernschwierigkeit oder mit Schwierigkeiten in 
der deutschen Sprache. Wenn man [...] bei Nachrichten wählen könnte, den Text in 
leichter Sprache angezeigt zu bekommen. Dann wäre es wieder eine Chance. 00:56:06 


(Focus Group III, Pos. 168) 


In der Gruppe der Medienkompetenten wird zudem auf die Möglichkeit hinge- 
wiesen, dass mit der automatisierten Erstellung von Routinetexten Ressourcen von 
Journalist:innen für komplexere journalistische Aufgaben freiwerden. 


Alina (30, Medien): [...] auf dem Stand [...] auf dem das [Anm.: automatisierter 
Journalismus] momentan noch ist, würde ich sagen, dass es den Redaktionen wahr- 
scheinlich eher hilft, sich auf die Themen zu konzentrieren, die mehr menschlichen 
Input brauchen [...] 00:36:18 


(Focus Group III, Pos. 106) 


8.4.3 Erfüllung der Erwartung an vertrauensbildende 
Maßnahmen 


Wie thematisiert, beginnen die Lesenden mehrheitlich erst in den Focus Groups mit 
der Reflexion über automatisierten Journalismus; sie geben überwiegend an, bisher 
keinen bewussten Kontakt mit computergenerierten Texten gehabt zu haben. Daher 
werden die Erwartungen an vertrauensbildende Maßnahmen in den Focus Groups 
nicht initial, zum Beispiel durch eine vorab stattgefundene Befragung, erhoben, son- 
dern mehrheitlich im Gespräch und in der Reflexion der vorgelegten Praxisbeispiele 
entwickelt. Demzufolge stellt die wahrgenommene Erfüllung von vertrauensbil- 
denden Maßnahmen an den Einsatz des automatisierten Journalismus nur bedingt 
eine fundierte und reflektierte Position der Lesenden dar. Dennoch können erste 
Meinungsäußerungen zur Erfüllung der Erwartung hinsichtlich vertrauensbilden- 
der Maßnahmen diskutiert werden. Diese werden außerdem über die geäußerten 
Forderungen zum transparenten Umgang der Medienorganisationen mit automati- 
siertem Journalismus sichtbar (vgl. Abschnitt 8.4.5). 

Insgesamt sehen die Lesenden ihre Erwartungen hinsichtlich vertrauensbilden- 
der Maßnahmen der Medienorganisationen nicht erfüllt. Sie erwarteten eine deutlich 
sichtbare Kennzeichnung von automatisiert generierten oder hybrid erzeugten Nach- 
richtentexten und sind enttäuscht über die Art der Kennzeichnung der automatisiert 
generierten Texte in den Praxisbeispielen. 
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Wilfried (45, Technologie): [...] ehrlich gesagt, die Aufbereitung gefällt mir nicht. 
Der Text selbst liest sich gar nicht schlecht, aber die Art und Weise, wie der präsentiert 
wurde, gefällt mir nicht. 00:52:56 

(Focus Group II, Pos. 233) 

Tom (32, Durchschnitt): Das [Anm.: Kennzeichnung im Praxisbeispiel] finde ich 
schon teilweise irreführend, aber andererseits dann vielleicht auch clever gemacht 
von denen. Aber es wird nie so richtig aufgeklärt, es kann also sein, dass der Autor 
diesen Artikel verfasst hat und dass es verschiedene Templates wahrscheinlich gibt 
und einfach nur die Zahlen aktualisiert werden. [...] 00:27:59 


Christine (49, Durchschnitt): Wenn sie statt einem Bild von dem Clemens [Anm.: 
Autorenangabe im Praxisbeispiel] einen kleinen Roboter zeigen, also wenn das 
gekennzeichnet wird. Dann weiß ich, da habe ich es mit Informationen zu tun, die 
automatisch generiert wurden und dann hätte ich von vornherein das Gefühl, hier wird 
offen kommuniziert. [...] 00:32:35 


(Focus Group I, Pos. 99, 114) 


Außerdem erwarten die Teilnehmenden deutlich mehr Informationen der Medien- 
verantwortlichen über die Funktionsweise, die zugrundeliegenden Technologien, 
das Ausmaß der computergenerierten Berichterstattung im deutschen Journalismus 
allgemein und Informationen über den konkreten Einsatz von Algorithmen, die mit 
Verfahren der Künstlichen Intelligenz arbeiten. 


8.4.4 Informationsbedürfnis und offene Fragen der Lesenden 


In allen drei Focus Groups wird ein hohes Informationsbedürfnis gegenüber automa- 
tisierten Journalismus geäußert. Der Wunsch nach weiteren Informationen bezieht 
sich entweder auf den individuellen Umgang mit automatisiertem Journalismus, die 
konkrete Ausgestaltung und Verwendung der Technologie, insbesondere auf einen 
möglichen Einsatz von Verfahren, die mit Künstlicher Intelligenz arbeiten oder auf 
Veränderungen, die sich im System Journalismus auf der Makroebene ergeben. 
Teilweise entstehen aus den geäußerten Informationsbedürfnissen konkrete Forde- 
rungen an den Einsatz der Technologie, diese werden im Folgeabschnitt (vgl. 8.4.5) 
besprochen. 

In Bezug zur individuellen Ebene wird in allen Focus Groups mehrfach ange- 
sprochen, ob und wie Lesende automatisiert generierte Texte erkennen können. Die 
Teilnehmenden wollen wissen, ob es Kennzeichnungsregeln oder Merkmale gibt, 
anhand derer man computergenerierte Texte erkennen kann. Zudem fragte eine 
Teilnehmerin nach, ob es die Möglichkeit eines Vergleichs zwischen einem compu- 
tergenerierten und menschlich verfassten Text zu einem Thema gibt. Insbesondere 
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die medienkompetenten Teilnehmenden äußern Unverständnis über fehlende Kenn- 
zeichnungsregelungen im Journalismus. 


Wilfried (45, Technologie): [...] Ich glaube, ich würde das Erkennen der maschi- 
nengeschriebenen Texte schon fast als Sport betrachten: Also mich würde das reizen, 
herauszufinden, wie lange ich das noch erkennen kann. [...] 00:34:37 


(Focus Group II, Pos. 117) 

Jan (32, Medien): Warum nicht oder? 01:09:12 

Alina (30, Medien): Ja, das ist die Frage. Warum werden die Texte nicht gekennzeich- 
net? Eigentlich soll man ja immer so transparent wie möglich (-) 01:09:23 

(Focus Group III, Pos. 209-210) 


Ein hohes Informationsbedürfnis besteht zudem in der Ausgestaltung und Verwen- 
dung des automatisierten Journalismus: Hier wollen die Teilnehmenden mehr über 
die Datengrundlage, die Funktionsweise der Modelle, die Verwendung von Verfah- 
ren, die mit Künstlichen Intelligenzen arbeiten, wissen. Außerdem wird nach der 
Anbindung der Algorithmen in redaktionelle Prozesse gefragt. Lesende äußern ein 
Informationsbedürfnis hinsichtlich der Programmierung, Kontrolle und Freigabe 
der computergenerierten Texte. Vielfach angesprochen werden auch die hybriden 
Verfahren und die Ausgestaltung der Mensch-Maschine-Interaktion durch Journa- 
list:innen sowie die Umsetzung einer Kontroll- oder Redigierfunktion in Redaktio- 
nen. Zudem fragen Teilnehmende nach möglichen inhaltlichen Vorgaben für Algo- 
rithmen und nach Regelungen hinsichtlich der Verantwortung für automatisierte 
Nachrichten. 


I: Was würdest du denn gerne noch darüber wissen wollen? 00:40:14 


Max (29, Durchschnitt): Wer es programmiert hat und ob der mit seiner Meinung 
einen Einfluss hat auf das, was geschrieben wird [...] 00:41:04 


(Focus Group I, Pos. 131-132) 


Sandra (53, Technologie): [...] Aber was heißt automatisiert generiert überhaupt? 
Heißt das, da sitzt ein Apparat, der den Text erfasst? [...] 00:52:21 


Wilfried (45, Technologie): Dahinter stehen ja viele weitere offene Fragen. [...] Und 
die andere Frage ist noch, wie maschinengeschrieben sind die Texte? Sind sie komplett 
maschinengeschrieben und werden sie nicht mehr gegengelesen? Oder werden sie von 
der Maschine vorgeschrieben und es wird noch feingeschliffen oder macht nur noch 
jemand einen Sanity-Check? [...] 00:34:37 


(Focus Group II, Pos. 230, 117) 


Daria (32, Medien): Mich würde interessieren, [...] wie das aufgebaut wird. [...] wenn 
ich die Datengrundlage habe, wie komme ich dann zu meinem Text? Es gibt ja die 
Beispiele mit Natural Language Processing, wo man Texte oder Wörter extrahieren 
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kann. Oder es gibt Sentiment Scores, das bedeutet man kann Wörter mit Stimmungen 
belegen. Hier würde es mich interessieren, wie das grundsätzlich im Journalismus 
funktioniert und ob das angewendet wird? [...] So etwas finde ich einfach wichtig, 
wenn am Ende ein Text rauskommt, der nicht ein Fußballberichterstattung ist oder 
Coronazahlen darstellt. 01:23:01 


(Focus Group III, Pos. 269) 


Bezogen auf das System Journalismus als Ganzes haben Lesende zudem ein Infor- 
mationsbedürfnis über das Ausmaß automatisiert generierter Texte im deutschen 
Journalismus. Dies ist, so einige Teilnehmende, insbesondere als Grundlage der 
individuellen Vertrauensbewertung relevant und begründet die mehrfach geäußerte 
Forderung nach einer Kennzeichnung oder Markierung computergenerierter Texte, 
die im Folgenden weiter ausgeführt wird. 


8.4.5 Forderungen zum Technologieeinsatz im Journalismus 


Die Teilnehmenden fordern eine Kennzeichnung automatisiert generierter Nach- 
richtentexte, klare Verantwortlichkeitsregelungen sowie weitere Maßnahmen zur 
Herstellung einer ‘algorithmic accountability’ ©. In allen Focus Groups fordern die 
Teilnehmenden eine Kennzeichnung oder Markierung für automatisiert oder hybrid 
erzeugte Nachrichtentexte. Bei einigen wird die Forderung nach einer nachvollzieh- 
baren Kennzeichnung mit fortschreitendem Gesprächsverlauf noch deutlicher. 


Wilfried (45, Technologie): Also sind wir uns auf alle Fälle ziemlich einig, dass wir 
eine Markierung der [Anm.: maschinengeschriebenen] Texte gerne hätten. 01:08:14 
(Focus Group II, Pos. 307) 

Christine (49, Durchschnitt): [...] Ich habe jetzt im Laufe unserer Unterhaltung für 
mich festgestellt, dass mir das tatsächlich immer wichtiger wird, dass es eine klare 
Kennzeichnung geben wird. So wie auf den Zigaretten draufstehen darf und mit Bildern 
untermauert sein darf, was Nikotin mit einem anstellt. [...] 01:18:36 


(Focus Group I, Pos. 246) 


Am vorgelegten Fallbeispiel zur automatisierten Corona-Berichterstattung (vgl. Pra- 
xisbeispiel in Abschnitt 3.3.3) diskutieren die Lesenden die Art der Kennzeichnung 


6 Unter ‘algorithmic accountability’ werden Herausforderungen im Umgang mit algorithmi- 
schen Systemen zur Kontrolle und Überprüfbarkeit der Systeme sowie die Frage nach der 
Verantwortungsübernahme diskutiert (vgl. Heise 2016: 207). Im Zusammenhang mit auto- 
matisiertem Journalismus werden die Herausforderungen zur Ausbildung einer ‘algorithmic 
accountability’ in Abschnitt 3.4.2 erläutert. 
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und äußern zunächst Missfallen gegenüber der Darstellung. Sie fordern eine unmiss- 
verständliche Kennzeichnung der Texte, die im Inhalt und in der Aufmachung pro- 
minent über die Art der Textgenerierung aufklärt. Für die Teilnehmenden ist eine 
deutliche Markierung direkt in der Autor:innenzeile wichtig und geht über eine 
kurze Information eines seitlich oder am Textende platzierten Informationskasten 
hinaus. 


Sandra (53, Technologie): [...] dass es prominenter präsentiert ist. Dass man [...] den 
Hinweis auch bewusst liest und zwar am Anfang und nicht erst irgendwo am Ende. 
[...] 00:50:51 

(Focus Group II, Pos. 219) 

Maxim (30, Medien): [...] [ich würde] einen Text rechts unten, auch gar nicht wahr- 
nehmen [...] Da müsste es eher ein roter Hinweis noch über dem Artikel sein. 00:41:42 


(Focus Group III, Pos. 123) 


Begründet wird die Forderung nach einer deutlichen Kennzeichnung mit der Ideal- 
vorstellung eines transparent agierenden journalistischen Systems und dem aktuell 
hohen Informationsbedürfnis der Teilnehmenden gegenüber der technologischen 
Neuerung (vgl. Abschnitt 8.4.4). 


Noah (34, Medien): [...] Ich würde es [Anm.: eine Kennzeichnung] schon erwarten, 
aber es hat auch nichts geändert, es ist einfach ein neutraler Text, der auch neutral 
dastehen kann wie eine Statistik und deshalb brauche ich in dem Fall auch diesen 
Hinweis nicht [...] 00:46:01 


Maxim (30, Medien): [...] ich finde es wichtig, vor allem so lange das in einer Über- 
gangszeit ist [...] Dass man weiß, womit man es zu tun hat und dass man auch die 
Möglichkeit hat, das zu hinterfragen. 01:10:21 


(Focus Group III, Pos. 135, 215) 


Unterschiedlich bewerten die Teilnehmenden dabei, ob einfache Routinetexte und 
kurze Sachinformationen, die automatisiert generiert erzeugt wurden, gekennzeich- 
net werden sollen. Hier meinen einige, dass in diesen Fällen eine Kennzeichnung 
für sie nicht notwendig ist, die Mehrheit fordert dagegen eine Kennzeichnung für 
alle automatisiert und hybrid erzeugten Texte. Außerdem erwarten Einzelne zudem 
Informationen, die über die Kennzeichnung hinausgehen. 


I: Und würdest du von der Zeitung erwarten, dass sie das transparent machen? Oder 
wer soll das kommunizieren? 01:23:24 


Daria (32, Medien): Das hängt davon ab, welcher Text am Ende dabei rauskommt. 
Bei der Coronaberichterstattung zum Beispiel ist es relativ einfach und neutral. Aber 
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wenn es in Richtung Meinungsbildung und Kommentar geht, dann würde ich schon 
gerne wissen, wie diese Texte zustandekommen und wie die Texte bewertet wurden, 
die veröffentlicht werden. 01:23:45 

I: Das Wissen wünscht du dir von der Zeitung, die das einsetzt? 01:23:49 

Daria (32, Medien): Ja. 01:23:50 

(Focus Group III, Pos. 272-275) 


Angemerkt wurde weiterhin, dass eine Markierung in der Praxis möglicherweise 
schwer umzusetzen sei, da auch über Nachrichtenagenturen Textbausteine geliefert 
werden und somit nicht alle Textteile eindeutig zugeordnet werden könnten. Hier 
fragen Teilnehmende nach der realistischen Umsetzung von Kennzeichnungen. 

Die Forderung nach der Kennzeichnung wird unter allen Teilnehmenden einstim- 
mig geteilt und eindringlicher wiederholt, wenn auf automatisierte Textgenerierung 
verwiesen wird, die mit Hilfe von Algorithmen der Künstlichen Intelligenz erzeugt 
wird. 

Im Zuge der Verständigung auf eine eindeutige Kennzeichnung automatisiert 
generierter Nachrichtentexte fordern die Lesenden zudem Informationen von den 
Medienorganisationen über die Zusammenarbeit von Mensch und Maschine im 
Zuge der Texterstellung. Die Lesenden unterscheiden in ihrer Bewertung der Ver- 
trauenswürdigkeit, ob automatisiert generierte Texte mit oder ohne menschliche 
Kontroll- und Freigabeprozesse veröffentlicht werden und fordern mehrheitlich 
auch darüber eine klare Information. Außerdem erwarten einige Teilnehmende 
Informationen zu verantwortlichen Personen, die beispielsweise für etwaige Fehler 
und ihre Korrekturen in der Berichterstattung zuständig sind. 


Maxim (30, Medien): [...] da frage ich mich, ob dieser Text rein KI generiert ist oder 
wurde von denen allen doch ein [Anm.: menschlicher] Teil eingespeist oder haben die 
Autoren noch einmal drüber gelesen? Das finde ich jetzt nicht ganz klar formuliert. 
[...] 00:41:42 


Maxim (30, Medien): [...] dass man heute [Anm.: Journalismus ohne Automatisie- 
rung] auch einen Journalisten dafür verantwortlich machen kann, wenn doch mal ein 
Fehler passiert. Man möchte auch jemanden haben, dem man das zuordnen kann. Wo 
man zum Beispiel eine Rüge aussprechen kann oder Ähnliches. [...] 01:18:02 


(Focus Group III, Pos. 124, 248) 


Daneben entwickeln die Teilnehmenden in allen Focus Groups Forderungen einer 
‘algorithmic accountability’, um einen verantwortungsvollen Einsatz der automa- 
tisierten Berichterstattung durch geeignete Kontrollinstanzen regulieren, beglei- 
ten und bei Verstoß gegen ethische Vereinbarungen sanktionieren zu können. 
Diese Forderungen gelten insbesondere für den Einsatz von Algorithmen, die mit 
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Verfahren der Künstlichen Intelligenz arbeiten. Die Teilnehmenden diskutieren mit 
unterschiedlichem Nachdruck ethische (Selbst-)Verpflichtungen, politische Regu- 
lierung und die Einführung und Durchsetzung von organisationsinternen oder - 
externen Kontrollinstanzen. 


Viktoria (42, Technologie): Ja, das muss man halt irgendwie von politischer Seite her 
regulieren. 01:00:20 


(Focus Group II, Pos. 269) 
Maxim (30, Medien): Da müsste es im besten Fall eine ethische Vereinbarung dar- 


über [Anm.: die Verwendung von Automatisierung und die Datenherkunft] geben. [...] 
01:20:38 


(Focus Group III, Pos. 261) 


Mehrheitlich fordern die Lesenden Accountability-Maßnahmen, ohne dass ihre 
Umsetzung und Ausgestaltung deutlich und konkret formuliert werden kann. Dies 
zeigt, dass sich Lesende bisher nicht oder wenig intensiv mit den Auswirkungen 
des automatisierten Journalismus auseinandergesetzt haben und die Reflexion über 
den Einsatz und Forderungen zu dessen Gestaltung mehrheitlich erst im Gespräch 
der Focus Groups entwickelt werden. 


Noah (34, Medien): [...] eine Automatisierung-Kontroll-Instanz wäre auch ganz nett. 
01:24:04 


I: Was soll die machen? 01:24:08 


Noah (34, Medien): Eben solche Fragen (Pause), also wenn ein Medium automatisierte 
Texte anwendet, dass diese Kontrollinstanz solche Dinge gegenprüft. Wie wird es 
angewendet, welche Quellen bezieht diese Automatisierung mit ein? [...] 01:24:35 


Maxim (30, Medien): Beim Spiegel gibt es [...] so eine Kontrollinstanz. So etwas 
müsste es vielleicht auch in einem kleineren Ausmaß für solche Artikel geben. Aber 
das wäre echt schwer, glaube ich. 01:24:56 


(Focus Group III, Pos. 277-280) 


8.5 Vertrauen in automatisierten Journalismus 


Vertrauen in automatisierten Journalismus wird in den Focus Groups zum einen 
durch eine intuitive direkte Abfrage ermittelt und zum anderen in den Gesprächen 
über indirekte Äußerungen zur Wahrnehmung computergenerierter Berichterstat- 
tung und in Einschätzungen der Lesenden zu möglichen Veränderungen im Journa- 
lismus besprochen. Die intuitive Abfrage spiegelt dabei den Umgang in der Praxis 
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wider, den die Mehrheit der Lesenden haben, indem sie wenig oder nichts von der 
Existenz des automatisierten Journalismus wissen, keinen bewussten Kontakt und 
daher wenig Gelegenheit zur intensiven Reflexion und Meinungsbildung haben. 
Dies zeigen auch das hohe Informationsbedürfnis und die Forderungen der Teilneh- 
menden nach einem transparentem Einsatz des automatisierten Journalismus (vgl. 
Abschnitte 8.4.4 und 8.4.5). Die Reflexion über automatisierten Journalismus in län- 
geren Gesprächen in den Focus Groups hingegen zeigt eine gesellschaftspolitische 
Debatte und Einflussfaktoren auf die Vertrauensurteile, die den Lesenden wichtig 
sind, um eine fundierte Bewertung des automatisierten Journalismus nachvollziehen 
zu können. 

Dabei zeigen sich deutliche Unterschiede in den Vertrauensbewertungen der 
einzelnen Focus Groups. Besonders die Komplexität der Vertrauensbewertung in 
Journalismus wird sichtbar, indem Vertrauensurteile keine monokausalen Zusam- 
menhänge aufweisen und von einer Reihe von Einflussfaktoren abhängig sind. Ins- 
gesamt dient die Vertrauensfrage als Grundlage für die Aufarbeitung ausgewähl- 
ter Einflussfaktoren auf die Vertrauensbewertung, die im Einzelnen im folgenden 
Abschnitt 8.6 erläutert werden. 

In Focus Group I (Durchschnitt) überwiegt zunächst die Skepsis gegenüber 
automatisiertem Journalismus; die Teilnehmenden geben mehrheitlich an, dass die 
Kenntnis über automatisiert generierte Nachrichten ihr Vertrauen in Journalismus 
im Allgemeinen schwächt. Eine Person steht dem Einsatz der Textautomatisierung 
dagegen neutral gegenüber und betont die Verantwortung der Lesenden, sowohl 
menschlich verfasste als auch computergenerierte Texte kritisch zu rezipieren. In 
dieser Focus Group sind insgesamt vier Personen beteiligt, die noch nie oder bisher 
wenig von automatisiertem Journalismus gehört haben. Die Antworten können als 
erste Reaktionen auf die Kenntnis der Existenz von automatisiertem Journalismus 
g ewertet werden. In der Begründung ihrer Vertrauensurteile beziehen sich die Teil- 
nehmenden auf ein subjektives, diffuses Gefühl, wenig Wissen zur Technologie, 
offene Fragen zum konkreten Einsatz der Anwendung und zudem die Frage nach 
der Kontrolle computergenerierter Texte und ihrer konkrete Einbindung in Redak- 
tionen. 


Max (29, Durchschnitt): [...] Solange keine Person irgendwie dahintersteht, ist das 
nicht so richtig glaubwürdig, wenn man es einfach nur vorgeschrieben bekommt. Das 
Gefühl hat man zumindest. 00:18:10 


Christine (49, Durchschnitt): [...] [Ich] bin [...] auch bei dir Max, wenn gar kein 
Mensch mehr drüber guckt oder das völlig unsupervised abläuft, dann gewinnt doch 
wieder die Skepsis. 00:20:21 


(Focus Group I, Pos. 66, 68) 
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Die Teilnehmenden in Focus Group I (Durchschnitt) haben im Vergleich zu den 
anderen am wenigsten Vorwissen zur automatisierten Textgenerierung und äußern 
zudem das geringste Vertrauen in automatisierten Journalismus. Nach etwa einer 
Stunde Gesprächsdauer werden die Teilnehmenden erneut zum Vertrauen in auto- 
matisierten Journalismus und dem Vertrauen in Journalismus, der mit computer- 
generierten Nachrichten arbeitet, gefragt. Hier ist eine Verstärkung der intuitiven 
ersten Antworten zu beobachten: Die drei Personen, die anfangs eher Skepsis gegen- 
über Vertrauen in automatisierten Journalismus äußerten, berichten, dass ihr Ver- 
trauen nun entweder nicht größer geworden oder deutlich gesunken ist. Die anfangs 
neutral eingestellte Person sowie die Teilnehmerin, die zu Beginn ein differenzier- 
tes Urteil abgab — und sich sowohl skeptisch äußerte als auch mögliche positive 
Konsequenzen bedacht hat — berichten, dass sich ihr Urteil nicht verändert habe. 
Insgesamt verändert keine Person in den drei Focus Groups am Ende der Gespräche 
ihr Vertrauensurteil wesentlich. Allerdings scheinen die Teilnehmenden in ihren 
Urteilen deutlich sicherer zu sein; die Tonalität der Bewertungen fällt entschiede- 
ner aus. Zudem betonen die Teilnehmenden in den Abschlussstatements einzelne 
Punkte, die ihnen in ihren Vertrauensurteilen besonders wichtig sind. Diese werden 
im Detail in Abschnitt 8.6 aufgegriffen. 


I: [...] Wenn ihr — nach dieser Stunde — das Thema automatisierter Journalismus hört, 
wie es euch jetzt in Bezug auf Vertrauen? 01:12:46 


Elfriede (72, Durchschnitt): Das Vertrauen ist nicht größer geworden, weil man sich 
ein bisschen damit beschäftigt und insgesamt zu wenig Einblick hat. Und trotzdem 
muss ein Grundvertrauen da sein, dass doch irgendwo immer etwas Positives raus- 
kommt, weil einfach genug Menschen da sind, die daran interessiert sind. Ich hoffe, 
das stimmt. 01:13:30 


Anne (32, Durchschnitt): [...] ich muss sagen, mein Vertrauen hast du [Anm.: mit der 
Focus Group] auch deutlich verringert [...]. 01:14:08 


(Focus Group I, Pos. 234-236) 


Dagegen bewerten die Teilnehmenden mit hohem Technologiewissen in Focus 
Group II das intuitive Vertrauen in automatisierten Journalismus weniger skep- 
tisch und die Mehrheit nimmt eine neutrale Position ein: Nur eine Person äußert 
sich direkt deutlich negativ, eine weitere sieht keine Auswirkungen der automati- 
sierten Berichterstattung auf ihr allgemeines Vertrauensurteil in Journalismus und 
zwei Personen sind unschlüssig und beschreiben sowohl mögliche positive als auch 
negative Möglichkeiten des automatisierten Journalismus. Die fünfte Person äußert 
sich nicht. Die Vertrauensurteile werden mit den wahrgenommenen technologischen 
Limitationen und dem fehlenden Wissen über den konkreten Einsatz von Künstli- 
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cher Intelligenz im Journalismus begründet. Zudem werden in den Urteilen erste 
Einflussfaktoren auf die Wahrnehmung der Grenzen des Einsatzes von automati- 
sierter Berichterstattung angesprochen (vgl. Abschnitt 8.6). Deutlich negativ äußern 
sich die Teilnehmenden hinsichtlich eines Vertrauensurteils, wenn automatisierter 
Journalismus mit Hilfe von Algorithmen der Künstlichen Intelligenz umgesetzt 
wird. 


I: Und was macht das [Anm.: Existenz automatisierter Journalismus] mit eurem Ver- 
trauen in Journalismus? 00:28:59 

Paul (35, Technologie): Nichts Gutes. 00:29:02 

I: Inwiefern? 00:29:05 

Sandra (53, Technologie): Naja, ich weiß nicht, ob das Vertrauen tatsächlich so darun- 
ter leidet. [...] Eine KI kann genauso einen hanebüchenen Blödsinn schreiben wie ein 
Journalist, der sich einfach keine Mühe gibt und einfach nur etwas hinrotzt und nicht 
recherchiert und nicht nachdenkt. Dann würde ich der KI, zumindest was die Fakten 


und die Recherche mit Such-Algorithmen betrifft, vielleicht noch mehr zutrauen als 
einem Journalisten. [...] 00:29:48 


Paul (35, Technologie): Es kommt wahrscheinlich immer drauf an, was die KI an 
Vorinformationen hatte, um daraus zu lernen und daraus dann etwas Neues zu machen. 
[...] 00:30:10 


Wilfried (45, Technologie): Ja, ich glaube, da ist wieder die genau diese Informatio- 
nen, die man auch bei normalen Journalisten hat. Welche Intention, welche Quellen 
hat der, welche Motivation steckt dahinter? Das ist ja bei automatisiertem Texten nicht 
anders: auf welcher Basis schreibt diese KI ist ja genau die gleiche Frage. Wenn das 
transparent wird und wenn klar ist, auf welcher Datenbasis ein Text generiert wird, 
dann glaube ich, muss das Vertrauen nicht unbedingt leiden. Ganz im Gegenteil viel- 
leicht kann man dann sogar ein höheres Vertrauen entwickeln, weil man dann vielleicht 
glauben könnte, dass das Ergebnis relativ objektiv sein könnte. Da sind aber jetzt ein 
paar Fragezeichen dabei. Ein paar sehr große Fragezeichen. 00:30:56 


(Focus Group II, Pos. 102-106) 


Für die Teilnehmenden mit hoher Medienkompetenz in Focus Group Ill hat die Exis- 
tenz des automatisierten Journalismus dagegen mehrheitlich keine Auswirkung auf 
ihre Vertrauensurteile in Journalismus: Fünf Teilnehmende geben an, dass sich ihr 
Vertrauen nicht ändert, die sechste Teilnehmerin äußert sich nicht. Im Gespräch 
spricht eine Teilnehmerin zudem von der möglichen positiven Auswirkung des Ein- 
satzes von Künstlicher Intelligenz im automatisierten Journalismus und ändert damit 
ihre neutrale Haltung. Die neutrale Bewertung der Vertrauenswürdigkeit begrün- 
den die Teilnehmenden mit ihrem Wissen über die aktuell begrenzten technologi- 
schen Möglichkeiten der automatisierten Textgenerierung und die Einbindung der 
Technologie in vertrauenswürdige professionelle Medienorganisationen und deren 
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Kontroll- und Korrektursysteme. Ein Teilnehmer merkt aber an, dass sich sein neu- 
trales Vertrauensurteil nur auf professionellen Qualitätsjournalismus bezieht, nicht 
auf Medien und Journalismus im Allgemeinen. 


Alina (30, Medien): Bei mir auch nicht [Anm.: keinen Einfluss], nein. Also auf dem 
Stand, soweit ich das weiß, auf dem das momentan noch ist, würde ich sagen, dass es 
den Redaktionen wahrscheinlich eher hilft, sich auf die Themen zu konzentrieren, die 
mehr menschlichen Input brauchen also (...)? 00:36:18 


Jan (32, Medien): Journalismus ist ja das ganze System, das würde ich einschränken. 
Aber wenn es weiterhin um Vertrauen in Qualitätsjournalismus geht und dort das 
[Anm.: die automatisierte Textgenerierung] verwendet wird, dann habe ich da immer 
recht hohes Vertrauen. [...] 00:36:51 


Daria (32, Medien): [...] wenn das ein Standardtext ist [...] und das basiert auf KI, 
dann ist meine Vertrauenswürdigkeit höher, weil ich weiß, dass das neutrale Zahlen 
sind, die aufgearbeitet und ausgespuckt werden. [...] 01:12:37 


(Focus Group III, Pos. 106, 108, 223) 


Zu Vertrauen in automatisierten Journalismus ist keine eindeutige Position erkenn- 
bar, auf die sich alle Teilnehmenden verständigen können. Einfluss auf die Vertrau- 
ensbewertung haben das Vorwissen zur Technologie, die Vorstellung über Algo- 
rithmen und Künstlichen Intelligenzen, das Wissen über journalistische Routinen 
und Kontrollmechanismen, die verwendeten Themen und Darstellungsformen, eine 
mögliche Einordnung und Kontingenz der Nachrichtentexte. Insgesamt spiegelt die 
Diskussion eine Abwägung verschiedener Argumente wider; die Bewertung der tat- 
sächlichen Praxisbeispiele ist eher neutral bis skeptisch. Die Teilnehmenden reflek- 
tieren unter anderem auch Szenarien, in denen sie den Einsatz der computergenerier- 
ten Berichterstattung befürworten würden und unter welchen Umständen sie eine 
positive Vertrauensentscheidung treffen würden (vgl. Abschnitte 8.4.2 und 8.4.5). 
Größere Vorbehalte gegen den Einsatz der Technologie beziehen sich vor allem auf 
mögliche künftige Weiterentwicklungen und gesellschaftliche Veränderungen im 
Journalismus als Ganzes (vgl. Abschnitte 8.4.1). 

Zur Beschreibung des wahrgenommenen allgemeinen Vertrauens in automa- 
tisierten Journalismus nehmen die Teilnehmenden in allen drei Focus Groups 
zunächst an, dass die Mehrheit der Bevölkerung über die Existenz des automati- 
sierten Journalismus aufgeklärt werden will. Weiterhin wird in allen drei Gruppen 
ausgeführt, dass aus Sicht der meisten Teilnehmenden vermutlich wenig oder kein 
weiterführendes Interesse der Bevölkerung am Gegenstand besteht. Es wird ein ers- 
tes anfängliches Interesse der Bevölkerung beschrieben, welches mittelfristig keine 
Relevanz mehr haben wird. Zusätzlich sprechen einige Teilnehmende von einem 
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vermutlich sinkenden Vertrauen der allgemeinen Bevölkerung in automatisierten 
Journalismus. 


Michael (39, Technologie): Denen ist das egal. 00:35:19 
Paul (35, Technologie): Ich glaube eher, dass es ein bisschen schwächt. So zu 10 bis 
20 Prozent ungefähr. Nicht besonders viel, aber schon ein wenig. 00:35:19 


Wilfried (35, Technologie): Ja, vielleicht für die ersten 20 Minuten und dann vergessen 
sie es. 00:35:34 


Paul (35, Technologie): Ja, stimmt. Der Mensch ist ein Gewöhnungsstier. [...] 00:35:37 


Viktoria (42, Technologie): [...] so insgesamt, wenn du das abfragen würdest, dann 
glaube ich schon, dass ein großer Teil sagen würde, dem vertraue ich weniger. [...] 
00:35:37 


(Focus Group I, Pos. 120-125) 

Maxim (32, Medien): Nein, ich glaube nicht, dass es die Leute Stand heute gut fänden. 
[...] 01:18:02 

(Focus Group III, Pos. 35) 


8.6 Einflussfaktoren der Vertrauensbewertung 


Als Einflussfaktoren für die Vertrauensbewertung werden spezifische Merkmale 
ausgewählt, die insbesondere in Verbindung mit der Wahrnehmung von Medien- 
innovationen stehen. Dazu werden Personenmerkmale, Spezifika des automatisier- 
ten Journalismus sowie betreffende Publikations- und Textmerkmale der compu- 
tergenerierten Berichterstattung aufgenommen und auf ihren Einfluss hinsichtlich 
der Vertrauensbewertung des Untersuchungsgegenstands durch Lesende untersucht. 
Die vorliegende Arbeit hat zudem das Ziel, explorativ weitere Einflussfaktoren auf 
die Vertrauensbewertung des automatisierten Journalismus zu prüfen. Auch darauf 
wird im Folgenden eingegangen. 


8.6.1 Ausgewählte Personenmerkmale 
Als für die Vertrauensbewertung des automatisierten Journalismus relevante Per- 


sonenmerkmale werden die Technologieaufgeschlossenheit, die Medienkompetenz 
und die Rezeption von Roboterdarstellungen in den Medien erhoben. 
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Technologieaufgeschlossenheit 

Die Teilnehmenden aus Focus Group I (Technologie) sind gegenüber dem automa- 
tisierten Journalismus deutlich neutraler eingestellt als beispielsweise die heteroge- 
nen Teilnehmenden aus Focus Group I (Durchschnitt). Die technologieaufgeschlos- 
senen Teilnehmenden treffen ihre Vertrauensurteile mit hoher Kontingenz und einer 
Reihe unterschiedlicher Bedingungen. Zusätzlich erwarten und fordern sie weitere 
Informationen zum konkreten Einsatz und der Funktionsweise des Einsatzes der 
automatisierten Textgenerierung im Journalismus. Die neutralen Vertrauensurteile 
beziehen sich vor allem auf den aktuell vermuteten Stand der Technik und des 
Technologieeinsatzes. 

Für Routinetexte und einfache Serviceanwendungen halten die technologieauf- 
geschlossenen Teilnehmenden den automatisierten Journalismus für vertrauens- 
würdig und gut geeignet, sobald die Kontingenz der Nachrichtentexte steigt und 
ein Algorithmus — oder noch deutlicher eine Künstliche Intelligenz — eine Bewer- 
tung vornehmen soll, äußern die Teilnehmenden eine sehr deutliche Ablehnung und 
negative Vertrauensurteile. Diese sehr großen Vorbehalte und deutlich negativen 
Gefühle nennen die Teilnehmenden insbesondere auch in Bezug auf künftige Wei- 
terentwicklung der bisherigen Anwendung. Hier äußern sich die technologieaffinen 
Teilnehmenden auch deutlich entschiedener als die Teilnehmenden der anderen bei- 
den Focus Groups. 


Medienkompetenz 

Teilnehmender mit hohem Vorwissen zu Journalismus und dem journalistischen 
Produktionsprozess schätzen die technologischen Möglichkeiten der automatisier- 
ten Berichterstattung aktuell noch als sehr beschränkt ein. Die Kenntnis über die 
Existenz des automatisierten Journalismus hat keine Auswirkungen auf ihr Ver- 
trauen in Qualitätsjournalismus, da sie eine hohe Anbindung an professionelle 
Medienorganisationen annehmen. 

Bezogen auf die Zukunft des automatisierten Journalismus beschreiben die Teil- 
nehmenden Chancen für die Berichterstattung, beispielsweise durch freiwerdende 
menschliche Ressourcen oder durch die Auslagerung von Routinetexten an die Soft- 
waresysteme der Textautomatisierung. Die Teilnehmenden vermuten aber auch eine 
künftig steigende Anzahl an Kommunikator:innen, die die technologischen Mög- 
lichkeiten der automatisierten Berichterstattung nutzen werden. Dazu befürchten 
sie, dass sich Filterbubble und Echochamber-Phänomene verstärken werden, da 
nicht-journalistische Akteur:innen nicht an journalistische Grundsätze und ethische 
Verpflichtungen gebunden sind. Bezogen auf mögliche Zukunftsszenarien bewer- 
ten medienkompetente Teilnehmende die Entwicklungen und Veränderungen des 
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Journalismus durch Textautomatisierungen und insbesondere durch den Einsatz von 
Verfahren der Künstlichen Intelligenz als sehr kritisch: 


Maxim (30, Medien): [...] Ich könnte noch nicht einmal sagen, ob sich die Beziehung 
[zwischen Lesenden und Journalismus] absolut negativ oder positiv verändern würde, 
aber ich habe das Gefühl es würde eine komplett andere Beziehung werden. Das ist 
irgendwie kein Journalismus mehr, sondern ja wirklich einfach eine Datenzusammen- 
fassung. Ich weiß jetzt auch nicht, was sich da wieder unterscheiden würde, wenn du 
mich danach fragst. Ich weiß es nicht. [...] Das [Anm.: automatisierter Journalismus] 
würde sich vielleicht so kalt anfühlen, wenn man sich vorstellt, dass [...] das alles nur 
noch auf irgendwelchen Datenauswertungen beruht. 01:18:02 


(Focus Group III, Pos. 248) 


Medienrezeption von Robotern und Künstlichen Intelligenzen 

Die Teilnehmenden sind sich einig, dass die Medienrezeption der Lesenden von 
Roboterdarstellungen oder Erzählungen über Künstliche Intelligenzen einen großen 
Einfluss auf ihre Wahrnehmung und Vertrauensbewertung des automatisierten Jour- 
nalismus haben. Diese Wirkung würde in beide Richtungen funktionieren und 
könnte sowohl eine positive als auch eine negative Wahrnehmung des automati- 
sierten Journalismus zur Folge haben. Aktuell berichten die Teilnehmenden aber 
einhellig davon, dass sie vor allem Mediendarstellungen von starken Robotern, über- 
mächtigen Künstlichen Intelligenzen und Maschinen in dystopischen Kontexten 
wahrnehmen und daher vor allem negative Bilder hinsichtlich Automatisierungen, 
Roboterdarstellungen und Künstlichen Intelligenzen, insbesondere in gesellschaft- 
lich relevanten Kontexten wie Journalismus, in ihren Vorstellungen dominieren. 


Christine (49, Durchschnitt): [...] da [Anm.: in Filmen] hat man es ja hautnah erlebt, 
wie mächtig diese Dinger werden können. Also ich könnte mich da nicht befreien 
davon. 01:10:43 


I: Und welchen Gedanken nimmst du dann mit, wenn du an die Textroboter und an 
Journalismus denkst? 01:11:03 


Christine (49, Durchschnitt): Die beherrschen uns alle. (lacht) 01:11:04 


Tom (32, Durchschnitt): Ja, genau. Die werden viel zu mächtig für uns. (lacht) [...] 
01:11:21 


(Focus Group I, Pos. 221, 226-228) 


Insgesamt, so formulieren es die Teilnehmenden, gehen sie davon aus, dass Medi- 
endarstellungen von Robotern nicht nur sie persönlich, sondern vielmehr die Vor- 
stellungen der Öffentlichkeit prägen. Insbesondere in Deutschland, so nehmen es 
die Teilnehmenden weiter wahr, sind große Teile der Bevölkerung sehr skeptisch 
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gegenüber technologischen Neuerungen eingestellt. Damit treffen dystopische 
Mediendarstellungen auf eine technologieskeptische Bevölkerung und dies, so die 
Annahme der Teilnehmenden, wird die Wahrnehmung des automatisierten Journa- 
lismus bei der Mehrheit der Deutschen vor allem negativ beeinflussen. 


Sandra (53, Technologie): Ich glaube, da gibt es auch sehr viel Skepsis gegenüber 
technischen Neuerungen. [...] Gerade in Deutschland gibt es sehr viel Skepsis gegen- 
über Technik. [...] Und dass es in den USA oder so zum Beispiel komplett anders 
aussieht, weil die auch ganz anders an Technik und an Digitalisierung rangehen. [...] 
00:36:48 


(Focus Group II, Pos. 131) 


Die Auswirkungen der Mediendarstellungen beschreiben die Teilnehmenden als 
so wirkmächtig, weil diese für die Lesenden die Möglichkeit ist, mit fehlenden 
Informationen umzugehen: Es gibt zu wenig Wissen in der Bevölkerung über auto- 
matisierten Journalismus und daher nutzen die Menschen insbesondere Medien- 
darstellungen, um sich eine Meinung über Automatisierungen im Allgemeinen und 
computergenerierte Berichterstattung im Speziellen zu bilden. Roboter und Künstli- 
che Intelligenzen werden häufig in dystopischen Kontexten dargestellt und es über- 
wiegen Darstellungen mächtiger und starker Künstlicher Intelligenzen, die mittel- 
fristig die Welt beherrschen und die Menschen in verschiedenen gesellschaftlichen 
Bereichen dominieren. Diese Darstellungen beeinflussen - nach Wahrnehmung der 
Teilnehmenden - schlussendlich auch die Vertrauensbewertung des automatisierten 
Journalismus. 


Maxim (30, Medien): Ich glaube auch, dass das Wissen dazu [Anm.: automatisierter 
Journalismus] noch nicht richtig da ist. Selbst wir hier sind [...] auch nicht tief in dem 
Thema drin. Otto-Normalverbraucher ist das noch weniger. Ich glaube, dass man allein 
aus Filmen und Büchern oder auch zum Thema Bots gerade eher negativ konnotierte 
Meinungen dazu bekommt. [...] Das sind dann oft dystopische Kontexte, in denen das 
verwendet wird. 00:39:07 


(Focus Group II, Pos. 117) 


Zudem spricht eine Teilnehmerin an, dass die Verwendung des Begriffs „Roboter“ 
ihr Bild über automatisierten Journalismus und die Möglichkeiten und Grenzen der 
Technologie beeinflusst. 


Alina (30, Medien): [...] Ich finde vor allem auch das Wort „Roboter“ totalabgespaced, 
weil man sich da immer einen Roboter vorstellt. [...] 01:15:48 


(Focus Group III, Pos. 237) 
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8.6.2 Merkmale des automatisierten Journalismus 


Zu den spezifischen Merkmalen der computergenerierten Berichterstattung als mög- 
liche Einflussfaktoren auf die Vertrauensbewertung des automatisierten Journalis- 
mus zählen die allgemein fehlenden Kennzeichnungsregelungen im Journalismus 
sowie wenig Wissen der Lesenden über die Technologie, den Einsatz und die Ver- 
breitung der computergenerierten Berichterstattung. Außerdem werden der Einfluss 
der gestiegenen Komplexität der Nachrichtenproduktion (’Blackboxism’) sowie der 
Einsatz von Algorithmen, die mit Verfahren der Künstlichen Intelligenz arbeiten und 
eine steigende Personalisierung von Nachrichtenartikeln auf die Vertrauensbewer- 
tung diskutiert. 


Fehlende Kennzeichnungsregelungen automatisiert generierter Nachrichten 
Der Einfluss der fehlenden Kennzeichnung automatisiert generierter Nachrichten- 
texte auf das Vertrauen der Lesenden wird im Abschnitt zu den Publikations- und 
Textmerkmalen beschrieben (vgl. 8.6.3). Die Kennzeichnung ist für die Lesenden 
ein wesentliches Merkmal, um einen transparenten und informierten Umgang mit 
automatisiert generierten Texten herstellen zu Können. 

Die häufig fehlenden Kennzeichnungsregelungen im Allgemeinen und über das 
System Journalismus hinweg führen daher zu insgesamt sinkendem Vertrauen in 
Journalismus, da die Teilnehmenden den Medienverantwortlichen eine Absicht 
zur Täuschung hinsichtlich des journalistischen Produktionsprozesses und zur Täu- 
schung hinsichtlich der Textverantwortlichen unterstellen. 


Christine (49, Durchschnitt): Ja, also ganz unbedingt. [...] Wenn man sich dabei 
ertappt, wie man das hinterfragt, dann ist quasi das blinde Vertrauen schon mal weg. 
[...] 00:35:34 


(Focus Group I, Pos. 119) 


Die überwiegende Mehrheit der Teilnehmenden berichtet von insgesamt sinken- 
dem Journalismusvertrauen durch fehlende Kennzeichungsvereinbarungen oder 
verbindliche Kennzeichungsregeln für automatisiert generierte oder hybrid erzeugte 
Texte im deutschen Journalismus. 


I: Das heißt, eine Kennzeichnung der automatisiert generierten Texte würde euch mehr 
oder weniger Vertrauen in Journalismus entwickeln lassen? 01:10:44 


Alina (30, Medien): Ja [...] natürlich. [...] vor allem jetzt vor dem Hintergrund, dass 
man weiß, dass es öfter eingesetzt wird, als es gekennzeichnet wird. 01:10:57 


(Focus Group III, Pos. 216-217) 
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Wilfried (45, Technologie): Ich würde sagen, dass die fehlende Markierung da [Ver- 
trauen der Lesenden in Journalismus] mit reinspielt. Ohne Markierung ist das schon ein 
Problem, weil das die Frage aufwirft, wo der Text eigentlich herkommt. Also: Hat den 
ein Computer ausgespuckt oder hat sich ein Mensch Gedanken gemacht und hat der 
Text genau den Prozess [Anm.: den journalistischen Produktionsprozess] durchlaufen 
oder nicht. [...] 01:14:25 


(Focus Group II, Pos. 343) 


Lediglich eine Person hat beschrieben, dass eine Markierung von automatisiert gene- 
rierten Texten keinen Einfluss auf ihre Wahrnehmung des Journalismus als Ganzes 
hat. Sie führt dazu an, dass sie vor der Erhebung bereits unbewusst Kontakt mit 
automatisiertem Journalismus hatte und die nachträgliche Erkenntnis darüber keine 
Änderung in ihrer Vertrauensbewertung hervorruft. Aus Gründen der Transparenz 
wünsche sie sich aber dennoch eine Kennzeichnung der automatisiert generierten 
Nachrichten. 


Noah (34, Medien): Also offensichtlich hat es keinen Einfluss, sonst hätte ich meine 
Medien bisher schon anders bewertet. Insofern würde ich sagen, wahrscheinlich hat 
es bisher keinen Einfluss darauf gehabt, wie ich Medien bewerte. Ich würde mir schon 
eine Kennzeichnungspflicht in irgendeiner Art und Weise wünschen. 01:09:10 


(Focus Group III, Pos. 208) 


Insgesamt reagieren die Teilnehmenden mit Unverständnis auf die häufig fehlende 
Kennzeichnung und fordern eine Markierung automatisiert generierter oder hybrid 
erzeugter Texte (vgl. Abschnitt 8.4.5). 


Wenig Wissen über automatisierte journalistische Berichterstattung 

Sowohl unter den einzelnen Lesenden, als auch in der öffentlichen Debatte und in der 
Kommunikationswissenschaft gibt es wenig Wissen über die Funktionsweise und 
den konkreten Einsatz des automatisierten Journalismus. Auch über das Ausmaß 
der Verbreitung automatisiert generierter Texte und die Anbindung an Redaktionen 
und Medienorganisation ist insgesamt wenig bekannt. Zum Einfluss des fehlenden 
Wissens über automatisierten Journalismus — sowohl auf individueller als auch auf 
gesellschaftlicher Ebene - äußern die Teilnehmenden ein hohes Informationsbedürf- 
nis zu den Hintergründen und zum konkreten Einsatz der automatisierten Bericht- 
erstattung und fordern klare Kennzeichnungen, Verantwortlichkeitsregelungen und 
Kontrollmechanismen (vgl. ausführlich in Abschnitt 8.4.5). Einige Teilnehmende 
argumentieren, dass es ihnen schwerfällt, überhaupt eine Vertrauensbewertung des 
automatisierten Journalismus vorzunehmen, da ihnen zu viele Informationen über 
die Technologie und den Einsatz fehlen. 
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I: Das heißt, du bräuchtest mehr Infos, um bewerten zu können, ob du dem Text 
vertraust oder nicht? 01:23:06 


Daria (32, Medien): Genau. Mir würde es nicht nur um die Datengrundlage gehen, 
sondern auch darum, wie das Modell gebaut ist. 01:23:15 


(Focus Group III, Pos. 270-271) 


Weiterhin beschreiben Einige, dass ihr Vertrauen in Journalismus beziehungsweise 
ihr Vertrauen in automatisierten Journalismus sinkt, wenn ihnen bewusst ist, dass 
es, sowohl individuell als auch gesellschaftlich zu wenig Wissen über Hintergründe 
und den tatsächlichen Einsatz der automatisierten Berichterstattung gibt. 


I: Hat dieses fehlende Hintergrundwissen Auswirkungen auf euer Vertrauen in auto- 
matisierte Texte? 00:57:37 

Paul (35, Technologie): Natürlich. 00:57:37 

I: Inwiefern, Paul? 00:57:38 

Paul (35, Technologie): Ich werde jetzt einfach allgemein Artikel noch kritischer 
betrachten, als ich es wahrscheinlich eh schon tue. Und manchmal werde ich vielleicht 
sogar — bevor ich einen zehn Minuten Artikel lese — nach unten scrollen und nach 
Hinweisen suchen, wer den Text entwickelt oder verfasst hat. Und wenn ich dann 
sehe, dass der in welcher Form auch immer automatisiert generiert wurde, dann weiß 
ich nicht, ob ich den Artikel noch so ernst nehmen kann, wie wenn der von einem 
Menschen geschrieben worden wäre. [...] 00:58:11 


(Focus Group II, Pos. 259-262) 


Die Teilnehmenden thematisieren beispielsweise den Einfluss der Softwareunter- 
nehmen, die die Textalgorithmen programmieren und fragen, ob sich diese an jour- 
nalistische Codizes oder Selbstverpflichtungen halten müssen. 


Max (29, Durchschnitt): Ja, auf jeden Fall ist mein Vertrauen noch weniger. Und bei 
mir kommt die Frage auf, warum wissen das nur die Softwarefirmen, die wahrschein- 
lich nicht unbedingt Journalisten sind. 00:40:09 


Christine (49, Durchschnitt): Haben denn Journalisten einen Ehrenkodex sowie die 
Ärzte? Gibt es den Eid des Journalisten oder so etwas, dass sie sich beispielsweise an 
der Wahrheit orientieren? 00:41:32 


(Focus Group I, Pos. 130, 137) 


Insgesamt äußern sich die Teilnehmenden kritisch hinsichtlich der Vertrauensbewer- 
tung des automatisierten Journalismus, wenn explizit fehlendes Hintergrundwissen 
thematisiert wird. Sie bekräftigen die Forderungen nach einem transparenten Ein- 
satz des automatisierten Journalismus und geben an, dass sie künftig insgesamt 
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kritischer Nachrichten rezipieren und auf Hinweise möglicher Automatisierung 
achten werden. Deutlich wird auch, dass die Vertrauensbewertung des automati- 
sierten Journalismus insbesondere in Verbindung mit fehlendem Wissen über die 
Existenz, Funktionsweise und Verbreitung der computergenerierten Berichterstat- 
tung keine abgeschlossene Meinungsbildung der Lesenden darstellt, von weiteren 
Informationen abhängt und eine stabile Vertrauensbeziehung mittel- und langfristig 
erst aufgebaut werden muss. 


Blackboxism über journalistischen Nachrichtenproduktionsprozess 
Durch automatisierten Journalismus beziehungsweise durch Journalismus, der 
regelmäßig mit automatisierter Berichterstattung arbeitet, steigen die Anforderun- 
gen an die Media Literacy der Lesenden, um Journalismus kritisch begleiten zu 
können. Angenommen wird, dass es durch Automatisierungen für Lesende schwie- 
riger wird, den journalistischen Nachrichtenprozess nachvollziehen zu können. Mit 
sinkender Nachvollziehbarkeit, fehlendem Wissen und intransparenten Verfahren 
sinkt das Vertrauen in automatisierten Journalismus. Die Teilnehmenden haben 
den Einfluss eines steigenden Blackboxism, also die steigende Komplexität und 
Nicht-Nachvollziehbarkeit der Nachrichtenproduktion, diskutiert und dazu unter- 
schiedliche Perspektiven angesprochen, die sich je nach individuellem Wissen über 
Journalismus und Medien unterscheiden. 

Grundsätzlich stimmen die Teilnehmenden in allen Focus Groups der Aussage 
zu, dass es für Lesende durch automatisierten Journalismus schwieriger wird, den 
journalistischen Nachrichtenprozess nachvollziehen zu Können. 


I: [...] dass durch den Einsatz dieser Textautomatisierungen es für Menschen 
vielleicht — vielleicht auch nicht — noch schwieriger wird zu verstehen, wie Jour- 
nalismus funktioniert. Wie zum Beispiel eine Nachricht zustandekommt. Würdet ihr 
dem zustimmen, dass es noch komplizierter wird? 00:42:22 


Tom (32, Durchschnitt): Das sehen wir ja bei uns jetzt gut. Also ja, ich denke das auf 
jeden Fall. 00:42:26 


Max (29, Durchschnitt): Ja. 00:42:27 
Elfriede (72, Durchschnitt): Ja. 00:42:28 
Christine (49, Durchschnitt): Ja.00:42:30 
Anne (32, Durchschnitt): Ja. 00:42:31 
(Focus Group I, Pos. 140-145) 


Michael (39, Technologie): Ich verstehe jetzt schon nicht, wie ein Artikel aus journa- 
listischer Sicht entsteht. [...] 01:14:39 


(Focus Group II, Pos. 345) 
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Unter den medienkompetenten Teilnehmenden aus Focus Group III wird ebenso 
besprochen, dass ein hochkomplexer und für die Lesenden schwer nachvollziehba- 
rer Nachrichtenproduktionsprozess zu sinkendem Vertrauen der Lesenden führen 
kann. Gleichzeitig könnte der Einsatz des automatisierten Journalismus aber, so 
die Teilnehmenden, auch dazu führen, dass Lesende eine Vereinfachung des Nach- 
richtenproduktionsprozesses wahrnehmen: Möglicherweise teilen die Lesenden die 
Vorstellung, dass Textalgorithmen und Automatisierungen eine Ordnung, Struktu- 
rierung und Vereinfachung der Nachrichtenproduktion erzielen, indem sie mögliche 
Bewertungsspielräume verringern, Eindeutigkeit in der Berichterstattung steigern 
und neutral und faktenbasiert berichten. Damit würde die Vorstellung einer Black- 
box als komplexen Nachrichtenproduktion aufgebrochen, indem Maschinen eine 
Ordnung- und Vereinfachungsfunktion zugeschrieben wird. Grundlage dieser Per- 
spektive ist aber erneut die Forderung eines aufgeklärten und informierten Umgangs 
der Lesenden mit automatisiertem Journalismus. 


Daria (32, Medien): [...] Vielleicht kann es auch sein, dass es das Vertrauen tatsächlich 
stärkt, weil es dann neutral und faktenbasiert wiedergegeben wird. [...] 01:12:37 


Alina (30, Medien): Ich meine, das ist auch eine Möglichkeit, dass man die Leute an 
das Thema ranführt. Es gibt in so vielen Bereichen schon Automatisierung und warum 
sollte man das dann den Leuten vorenthalten? 01:14:09 


(Focus Group III, Pos. 223, 229) 


Insgesamt zeigen die Äußerungen der Teilnehmenden zur steigenden Komplexität 
der journalistischen Nachrichtenproduktion, dass der Einfluss auf die Vertrauens- 
bewertung des Journalismus ein Faktor unter mehreren ist, der von den Teilneh- 
menden im Gespräch durchaus Berücksichtigung findet. Zusätzlich bekräftigen die 
Teilnehmenden die Forderung nach einem transparenten Umgang mit automatisier- 
tem Journalismus, um eine nachhaltig fundierte Vertrauensbewertung vornehmen 
zu können. 


Personalisierte Nachrichtentexte und Einsatz von Verfahren der Künstlichen 
Intelligenz 

Mit automatisiertem Journalismus können in Zukunft möglicherweise personali- 
sierte Nachrichtentexte in hoher Anzahl veröffentlicht werden und auch der Ein- 
satz von Verfahren der Künstlichen Intelligenz wird weitere Veränderungen in der 
journalistischen Textproduktion ergeben. Beides sind wichtige Veränderungen im 
Journalismus durch automatisierte Textgenerierung, deren tatsächliche Umsetzung 
im Wesentlichen erst in der Zukunft erwartet wird und aktuell wenig bis keine 
Anwendung in der Praxis findet. Daher werden sowohl die steigende Personalisie- 
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rung von Nachrichtentexten als auch der Einsatz von Verfahren der Künstlichen 
Intelligenz als Merkmale des automatisierten Journalismus und als Einflussfakto- 
ren auf eine Vertrauensbewertung des Journalismus im Abschnitt Erwartungen (vgl. 
Abschnitt 8.4) thematisiert. 


8.6.3 Publikations- und Textmerkmale 


Im Folgenden werden die Kennzeichnung, das Nachrichtenthema, die Darstellungs- 
form und der Einfluss der Medienorganisation als relevante Publikations- und Text- 
merkmale für die Vertrauensbewertung der Lesenden in automatisierten Journalis- 
mus besprochen. 


Kennzeichnung 

Automatisiert generiert oder hybrid verfasste Texte mit entsprechender Kennzeich- 
nung gelten unter den Teilnehmenden grundsätzlich als ebenso glaub- und vertrau- 
enswürdig wie menschlich verfasst Texte. Die Unterschiede in den Vertrauensbe- 
wertungen zwischen diesen beiden Textformen ergeben sich aus einer Kombination 
verschiedener Merkmale, worunter die Kennzeichnung ein relevanter Faktor ist. 


Wilfried (45, Technologie): [...] Aber wenn das [Anm.: computergenerierte Texte] 
ordentlich markiert ist — warum sollte das ein Problem sein? 01:14:25 


(Focus Group II, Pos. 343) 


Einige Teilnehmende weisen darauf hin, dass sie bei bestimmten Gelegenheiten 
sogar gezielt automatisiert generierte Texte zur Rezeption auswählen würden, wenn 
diese gekennzeichnet wären. Je nach Intention des Nachrichtenkonsums würden sie 
bevorzugt auf automatisiert generierte Texte zugreifen, wenn sie beispielsweise 
eine schnelle, aktuelle und personalisierte Berichterstattung suchen. Dagegen wür- 
den sie bei einigen Themen oder Meinungstexten (vgl. Abschnitt zur Intention als 
weiterer Einflussfaktor 8.6.4) automatisiert generiert gekennzeichnete Texte nicht 
konsumieren wollen. 


Christine (49, Durchschnitt): [...] wenn ich es weiß [Anm.: eine Kennzeichnung] und 
eine Statistik brauche oder wenn ich Informationen will, wo möglichst viele Daten in 
kurzer Zeit zusammengefasst sind, dann ist mir vielleicht sogar der kleine Roboter 
lieber [...] 00:35:34 


(Focus Group I, Pos. 119) 
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Damit wird deutlich, dass eine Kennzeichnung automatisiert generierter Nachrich- 
ten nicht dazu führt, dass Lesende diese Texte weniger häufig zur Rezeption auswäh- 
len, weil sie automatisiert generierte Nachrichten als nicht glaubwürdig ansehen. 
Im Gegensatz dazu führen aber die häufig fehlenden Kennzeichnungsregelungen zu 
insgesamt sinkendem Vertrauen in Journalismus, da die Teilnehmenden den Medi- 
enverantwortlichen eine Absicht zur Täuschung hinsichtlich des journalistischen 
Produktionsprozesses und der Textverantwortlichen unterstellen (vgl. ausführlich 
in Abschnitt 8.6.2 und Abschnitt 8.4.5). 

In Bezug auf die Kennzeichnung und die Auswirkung auf die wahrgenommene 
Vertrauenswürdigkeit ist bereits angesprochen worden, dass mittel- und langfristig 
durch Gewöhnungseffekte möglicherweise keine Auswirkungen der Kennzeich- 
nung auf die Vertrauenswürdigkeit des automatisierten Journalismus mehr feststell- 
bar sind. In der aktuellen Übergangs- und Einführungsphase der Technologie ist die 
Kennzeichnung automatisiert generierter Texte für Lesende aber sehr wichtig, um 
Erfahrungen im Umgang mit automatisiertem Journalismus zu sammeln. Die Teil- 
nehmenden haben ein hohes Bedürfnis an Informationen zur Technologie und zum 
Einsatz der automatisiert generierten Nachrichten, um eine fundierte Meinungsbil- 
dung und Vertrauensbewertung vornehmen zu können. Zur Vertrauensbewertung 
prüfen sie unter anderem Nachrichtenthemen, Meinungsformen und Intentionen 
der Nachrichtenauswahl, die im Folgenden dargestellt werden. Grundlage dieser 
Bewertung ist ein informierter und transparenter Umgang mit automatisiertem Jour- 
nalismus, der unter anderem auf gekennzeichneten automatisiert generierten Texten 
beruht. 


Nachrichtenthema 

Das Thema der automatisiert generierten Nachrichten ist für die Vertrauensbewer- 
tung des automatisierten Journalismus vor allem in den ersten spontanen Äuße- 
rungen sehr relevant. Über das Nachrichtenthema schließen die Teilnehmenden 
Themenbereiche aus, bei denen sie sich keine vertrauenswürdigen automatisiert 
generierten Nachrichten vorstellen können. Hier nennen die Teilnehmenden sensi- 
ble Nachrichtenthemen und Berichte, die einer hohen Einordnung und Abwägung 
von Argumenten bedürfen, wie beispielsweise Politik- und Kriegsberichterstattung. 


I: Gibt es Themen, wo ihr sagt, da ist automatisiert generiert ok? [...] 01:01:16 


Christine (49, Durchschnitt): [...] Niederschlagsmengen, Sonnenstunden oder Fein- 
staub oder Pollen [...] wo irgendwo Messstationen stehen, die Daten generieren, die 
man gut auch von einem Roboter auswerten lassen kann, das wäre für mich völlig in 
Ordnung. 01:01:46 
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I: Und was ist ein No-Go-Thema für dich? 01:01:49 
(Pause) 
Christine (49, Durchschnitt): Politische Themen finde ich schon schwierig. Das ist 


sowieso so komplex, weil Emotion und Rationalität sich da auch nicht so gut im 
Gleichgewicht halten können. 01:02:18 


Max (29, Durchschnitt): Da bin ich auch der Meinung. [...] politische Texte sind eher 
selten allgemein gehalten; in irgendeine Richtung gehen sie meistens. Ich finde auch, 
da sollte ein Journalist dahinter sitzen und (-) [...] aber wenn es keine Zahlen sind und 
es einfach nur runtergeschrieben wird, das ist schon komisch. 01:02:44 


(Focus Group I, Pos. 191-196) 


Im Laufe der Focus Groups und der intensiveren Beschäftigung mit dem Einfluss 
des Nachrichtenthemas kommen letztlich aber alle drei Gruppen zu dem Schluss, 
dass weniger das Thema, sondern vielmehr eine, im Text enthaltene, Einordnung 
oder Bewertung relevant ist. Es kommt nicht auf das Nachrichtenthema, sondern 
auf die Kontingenz des Textes an (vgl. 8.6.4). Die Teilnehmenden argumentieren 
beispielsweise, dass auch bei der Auswertung von Feinstaubdaten im vorgelegten 
Fallbeispiel des Feinstaubmonitors eine Wertung enthalten sein kann. Die Mehr- 
heit kann sich keine vertrauenswürdigen automatisiert generierten Texte vorstellen, 
wenn bei der Erstellung Algorithmen eigenständig und ohne menschliche Kontrolle 
Wertungen oder Kontingenzentscheidungen treffen. 


Viktoria (42, Technologie): Zum Beispiel dieser Feinstaubartikel. Wenn es dort nur 
um die reine Faktenerzählung gehen würde, wäre es für mich in Ordnung. Aber da steht, 
dass irgendetwas schlechter war, irgendetwas ist gut und das ist für mich ein Vergleich, 
eine Einschätzung. Wie will denn die KI Feinstaub einschätzen können? Klar, tut sie 
das auf Basis von den Zahlen und ein Wert war höher und ein Wert war niedriger und 
daher kommt die Bewertung gut und schlecht. Aber ich finde das schwierig, sobald 
eine Einordnung und Bewertung stattfindet, weil das ist ja Auslegungssache. 01:07:04 


(Focus Group II, Pos. 303) 


I: Dann ist auch das Thema nicht mehr relevant, sondern es geht darum, ob eine 
Einordnung dabei ist? 01:04:04 


Jan (32, Medien): Ja. 01:04:05 
(Focus Group III, Pos. 190-191) 


Journalistische Stil- und Darstellungsform 

Im Journalismus gilt das Gebot der Trennung zwischen Information und Mei- 
nung. Dieser Trennung folgend, werden journalistische Inhalte in informierende und 
kommentierende Stil- und Darstellungsformen eingeteilt. Informierende Texte wie 
Nachrichten oder Berichte enthalten Sachinformationen über ein Ereignis und keine 
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Meinungsäußerung oder Bewertung der Journalist:innen. Meinungsäußerung, Ein- 
ordnungen und Bewertungen sind dagegen explizit Kennzeichen der kommentieren- 
den Darstellungsformen wie Kommentare, Glossen oder Kolumnen. Im Folgenden 
wird der Einfluss beider Stil- und Darstellungsformen auf die Vertrauensbewertung 
des automatisierten Journalismus thematisiert. 

Die Mehrheit der Teilnehmenden kann sich grundsätzlich vorstellen, Vertrauen 
in informierende Darstellungsformen zu entwickeln. Hier beziehen sich die Teil- 
nehmenden vor allem auf die in den Gesprächen thematisierten Sport- und Wetter- 
berichte oder das vorgelegte Praxisbeispiel der Feinstaubmessung. 


Alina (30, Medien): [...] ein Sportbericht [...]. Zum Beispiel Verein A hat das Spiel 
so hoch gewonnen und so weiter. [...] da würde ich auch einen automatisierten Text 
vertrauenswürdig finden. [...] 00:31:00 


(Focus Group III, Pos. 92) 
Tom (32, Durchschnitt): Sachtext [...] finde ich ok im ersten Moment. 01:05:51 
(Focus Group I, Pos. 208) 


Dagegen können sich die Teilnehmenden - bis auf eine Ausnahme - nicht vorstel- 
len, Vertrauen in kommentierende Texte zu entwickeln, die von Algorithmen ohne 
weitere menschliche Bearbeitung oder Kontrolle generiert worden sind. Eine Teil- 
nehmerin ergänzt, dass sie computergenerierte kommentierende Darstellungsfor- 
men möglicherweise vertrauenswürdig finden würde, aber nur, wenn die Textquelle 
deutlich und transparent gekennzeichnet ist (vgl. auch Abschnitt 8.4.2). 


Alina (30, Medien): [...] ich kann es mir nicht vorstellen, einen automatisiert gene- 
rierten Kommentar zu lesen und den als vertrauenswürdig zu sehen. 01:04:43 


(Focus Group II, Pos. 193) 


In der Diskussion über den Einfluss der Darstellungsform wird deutlich, dass die 
Bewertung der Vertrauenswürdigkeit für die Teilnehmenden - ebenso wie beim Ein- 
fluss des Themas — nicht primär an der Stil- und Darstellungsform, sondern an einer 
möglichen Einordnung oder Bewertung von Fakten im Text liegt. Immer dann, wenn 
ein Algorithmus Sachverhalte bewerten, abwägen oder einordnen müsste, sinkt das 
Vertrauen in automatisiert generierte Texte beziehungsweise die Teilnehmenden 
können sich kein positives Vertrauensurteil vorstellen. 


Sandra (53, Technologie): [...] Wobei beim Wetterbericht wäre es schon wieder inter- 
essant, weil wenn geschrieben steht, dass in München heute 28 Grad sind und über- 
morgen sind es 37 Grad. Dann könnte natürlich die KI sagen, dass sich ganz München 
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über das schöne Wetter freut und das Thema Klimawandel außen vor zu lassen. Je 
nachdem wie tendenziös das geschrieben wird. 01:05:44 


Viktoria (42, Technologie): Das macht ja ein Mensch auch. 01:05:45 
Sandra (53, Technologie): Ja, das hast du da auch, stimmt. Aber da wäre die Frage, 
wie ich einen Artikel, der von einer KI geschrieben wird, wo es um Dinge geht, die zwar 


Zahlenartikel sind, aber schon eine ideologische Konnotation haben können (Pause). 
Was dann passiert (-) 01:06:06 


(Focus Group II, Pos. 298-300) 


Erneut wird im Gesprächsverlauf die Neugierde einiger Teilnehmenden auf die tech- 
nologischen Möglichkeiten und Grenzen der automatisiert genierten Berichterstat- 
tung sichtbar: Die Lesenden können sich nicht vorstellen, dass Algorithmen in der 
Lage sind, vertrauenswürdige kommentierende Darstellungsformen zu produzieren 
und sind neugierig, ob sie mit dieser Einschätzung richtig liegen. Kommentierende 
Darstellungsformen oder freiere komplexere informierende Texte wie Reportagen 
erfordern Kreativität, Bewertung, Abwägung - Fähigkeiten und Kompetenzen, die 
die Teilnehmenden Maschinen, Algorithmen und Künstlichen Intelligenzen abspre- 
chen. Dennoch würden einige Teilnehmende automatisiert generierte kommentie- 
rende und komplexe informierende Darstellungsformen gerne testen. Auch aus die- 
sem Grund fordern sie eine deutliche Kennzeichnung der Textquelle insbesondere 
für computergenerierte kommentierende Darstellungsformen. 


Christine (49, Durchschnitt): [...] ich [fände] es eigentlich auch echt interessant, wie 
mir ein Roboter seine oder ihre Meinung vermittelt [...] 01:06:52 


I: Ja, ob du einen Unterschied in deiner Bewertung zwischen Sach- und Meinungstext 
machst, liegt an der Kennzeichnung? 01:06:57 


Christine (49, Durchschnitt): Ja, wirklich nur an der Kennzeichnung. Und wenn ich 
dann ein paar Roboter-Meinungstexte gelesen habe und mir gedacht habe: Ne, das ist 
dann nicht so, dann würde ich gern meine Abstimmung revidieren und sage, die sollen 
bitte nur Sachtexte schreiben. (lacht) 01:07:14 


(Focus Group I, Pos. 209-211) 


Medienorganisation und Ort der Publikation 

Zum Einfluss der Publikation beziehungsweise der Medienorganisation gibt es unter 
den Teilnehmenden eine einheitliche Position, die sich in der Regel erst im Laufe 
des Gesprächs entwickelt. Mehrheitlich überwiegt die Position einer positiven wie 
negativen Kollektivhaftung: Wenn ein automatisiert generierter Texte in einem von 
den Lesenden als vertrauenswürdig angesehenen Medium erscheint, dann gilt auch 
der Text grundsätzlich als vertrauenswürdig. Die Lesenden gehen davon aus, dass 
hochwertige und vertrauenswürdige Medien einen verantwortungsvollen Umgang 
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mit Textalgorithmen und automatisiertem Journalismus pflegen und glauben an 
Qualitätskontrollen, eine engmaschige Überwachung der automatisierten Systeme 
und eine Freigabe von automatisierten Inhalten durch Verantwortliche. Die Vorstel- 
lung gilt umgekehrt auch für nicht-vertrauenswürdige Publikationen: Hier gehen 
die Lesenden von einem weniger sorgfältigen Umgang mit automatisiertem Journa- 
lismus aus. Automatisiert generierte Nachrichten, die in nicht-vertrauenswürdigen 
Medien erscheinen, werden als weniger vertrauenswürdig wahrgenommen. 


Christine (49, Durchschnitt): Ich glaube, das hat einfach was mit der gefühlten Inte- 
grität zu tun. Ja, bei der Süddeutschen oder bei der Zeit halte ich so an diesem Glauben 
fest, dass integer berichtigt wird. Und wenn die Journalisten dort einen Roboter mit 
einsetzen, dann würde ich den Roboter in positivem Sinne in Sippenhaft mitnehmen. 
Dass das Endresultat mit dem gleichen integeren Standard noch einmal betrachtet 
wird, bevor es in Druck geht oder bevor es online freigeschalten wird. Bei der ande- 
ren Presse, also wie Bild vielleicht, also Presse, die nicht zur Qualitätspresse gehört, 
die halte ich eh schon nicht für integer in ihrer Berichterstattung und da kommt der 
Roboter auch wieder mit in Sippenhaft, aber diesmal im negativen Sinne. 01:09:34 


(Focus Group I, Pos. 218) 
Daria (32, Medien): [...] wenn ich dem Qualitätsmedium Vertrauen zuspreche, dann 


würde ich auch davon ausgehen, dass sie die KI in einem vertrauenswürdigen Sinne 
nutzen. Also erstmal neutral. 00:37:13 


(Focus Group III, Pos. 110) 


Zusätzlich zur angesprochenen, einhelligen Wirkung der Publikation auf die Wahr- 
nehmung computergenerierter Nachrichten spricht ein Teilnehmer von einem sin- 
kenden Vertrauen in etablierte Zeitungen, wenn er von ihrem Einsatz computerge- 
nerierter Berichterstattung weiß. 


Paul (35, Technologie): Ich wäre trotzdem skeptisch gegenüber dem Medium, auch 
wenn ich es vorher mehr gemocht hätte und mehr vertraut hätte. Dann habe ich immer 
den Hintergedanken, hat es jetzt ein Mensch geschrieben oder hat ein Mensch drüber 
gelesen oder ist das komplett nur von einer KI entwickelt? [...] 00:33:49 


(Focus Group II, Pos. 115) 


8.6.4 Exploration weiterer Einflüsse 


Neben den besprochenen Einflussfaktoren auf die Wahrnehmung und Vertrauensbe- 
wertung des automatisierten Journalismus haben die Teilnehmenden in den Gesprä- 
chen weitere Faktoren genannt. Dazu zählt die Intention der Lesenden bei der Nach- 
richtenauswahl, die wahrgenommene Kontingenz der Nachricht und die Vorstellung 
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der Lesenden von Verfahren der Künstlichen Intelligenz. Insbesondere für die Inten- 
tion der Nachrichtenauswahl und die wahrgenommene Kontingenz der Texte ist 
erneut eine Kennzeichnung automatisiert generierter Texte notwendig, um beide 
Faktoren in einer Vertrauensbewertung mit einbeziehen zu können. 


Intention bei der Textauswahl 

Die Teilnehmenden betonen in allen Focus Groups an unterschiedlichen Stellen 
im Gespräch, dass sie computergenerierte Texte nicht grundsätzlich ablehnen und 
sich gute Einsatzmöglichkeiten für automatisierten Journalismus vorstellen können. 
Ein wichtiger Einflussfaktor auf die Frage, ob Lesende computergenerierte Texte 
als vertrauenswürdig bewerten, ist die Intention der Leser:innen bei der bewussten 
Auswahl automatisiert generierter Nachrichten. Teilnehmende berichten, dass sie zu 
bestimmten Anlässen oder Themen computergenerierte Texte klar den menschlich 
verfassten Texten vorziehen würden. Grundlage dafür ist eine transparente Kenn- 
zeichnung der Texte. Damit ist die Intention der Nachrichtenauswahl ein Faktor, der 
bei der Vertrauensbewertung des automatisierten Journalismus zu berücksichtigen 
ist. 


Anne (32, Durchschnitt): Vielleicht wäre es auch wichtig, was man von dem Text 
erwartet. [...] Wenn ich mich nicht intensiv für das Thema interessiere, dann brauche 
ich nicht jeden Tag einen von einem Menschen verfassten Text, der klitzeklein erklärt, 
sondern es reicht wahrscheinlich ein automatisierter Text. Und wenn aber irgendwo 
Krieg ist und ich will wissen warum und man doch ein bisschen mehr dazu wissen 
will. Und vielleicht will ich auch wissen, was die Person, die darüber berichtet, davon 
hält. Dann will ich das auf keinen Fall von einem Computer wissen, sondern doch 
von jemandem, der mir tatsächlich dann so die Meinung ein bisschen veräußert. Ich 
glaube, da kommt es wirklich darauf an, was es ist. [...] 00:33:57 


Christine (49, Durchschnitt): [...] Und wie Anne gesagt hat, wenn ich es weiß [eine 
Kennzeichnung] und eine Statistik brauche oder wenn ich Informationen will, wo 
möglichst viele Daten in kurzer Zeit zusammengefasst sind, dann ist mir vielleicht 
sogar der kleine Roboter lieber als möglicherweise der Praktikant, der in der Zeitung 
den Auftrag bekommen hat, da alles irgendwie zusammenzurechnen. [..] 00:35:34 


Anne (32, Durchschnitt): [...] Es wäre es cool, wenn man sich das aussuchen kann: 
‚Ich möchte gerne Nachrichten, die auf mich personalisiert sind‘ und ‚ich möchte 
neutrale Nachrichten‘ [...]. 00:55:09 
(Focus Group I, Pos. 117, 119, 180) 


Noah (34, Medien): [...] Bei der Feinstaubbelastung erwarte ich keine tiefergehende 


Einordnung eines Journalisten. Beieiner Wahl würde ich schon eine Einordnung erwar- 
ten. [...] 01:02:09 


(Focus Group III, Pos. 184) 
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Kontingenz des Nachrichtentexts 

Bei den Publikationsmerkmalen als Einflussfaktoren ist bereits beschrieben, dass 
primär nicht das Thema oder die Darstellungsform für die bewertete Vertrauens- 
würdigkeit des automatisierten Journalismus für die Lesenden relevant ist, son- 
dern die Kontingenz der Nachricht. Sobald eine Einordnung, eine Bewertung, eine 
Abwägung, ein So-oder-auch-Anders, also Kontingenz vorliegt, können sich die 
meisten Teilnehmenden keine vertrauenswürdigen computergenerierten Texte vor- 
stellen. Kontingenz kann, so die Teilnehmenden sowohl bei informierenden als auch 
bei kommentierenden Darstellungsformen und bei nahezu jedem Thema stattfinden. 
Allerdings gibt es Darstellungsformen und Themen, bei denen sowieso eine höhere 
Kontingenz erwartet wird und die computergenerierte Berichterstattung damit 
grundsätzlich als weniger vertrauenswürdig angesehen wird (vgl. Abschnitt 8.6.3). 


Noah (34, Medien): Ich würde dem Algorithmus auch keine Kriegsberichterstattung 
zuschreiben [...] wie soll der eine Bewertung des Ganzen vornehmen? [...]. Das würde 
ich ausschließen, da würde mein Vertrauen tatsächlich dann von den automatisierten 
Texten weggehen. 00:50:42 


(Focus Group III, Pos. 152) 


Die Teilnehmenden berichten, dass sie in der Vertrauensbewertung des automati- 
sierten Journalismus primär die Kontingenz und nur sekundär die Themen oder 
Darstellungsformen als entscheidende Faktoren berücksichtigen. Somit muss die 
Kontingenz einer Nachricht als relevanter Einflussfaktor auf die Vertrauensbewer- 
tung aufgenommen werden. 


Sandra (53, Technologie): [...] Es könnte schon mal ein Punkt kommen, an dem ich es 
[Anm.: die automatisierte Berichterstattung] grenzwertig finde. Aber wenn sich das auf 
dem Niveau bewegt, bei dem wir das gerade gesehen haben, bei der Feinstaubmessung, 
den Coronazahlen oder dem Wetterbericht. [...] 01:05:44 

Viktoria (42, Technologie): Also bei mir hört es [Anm.: das Vertrauen in maschi- 
nengeschriebene Artikel] auf. Sobald es um eine Einordnung geht oder irgendetwas 
in ein Verhältnis zu etwas anderem gestellt wird, dann wüsste ich gerne ob das eine 
KI gemacht hat oder ein Mensch und mit was für einem Hintergrund, also was ist die 
Ausrichtung, die irgendwie dahintersteckt. 01:06:28 


(Focus Group II, Pos. 298, 301) 


Vorstellung von Künstlicher Intelligenz 

Die Vorstellung der Teilnehmenden über die Funktionsweise und die Verbreitung 
von Künstlichen Intelligenzen im Journalismus übersteigt mehrheitlich die tat- 
sächlichen Anwendungsbeispiele und technologischen Möglichkeiten. Dies gilt in 
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besonderem Maße für Focus Group II (Technologie) und III (Medien). Die Vorstel- 
lung des großflächigen Einsatzes von Künstlichen Intelligenzen zur Textproduktion 
im deutschen Journalismus ohne engmaschige menschliche Kontrolle übersteigt den 
tatsächlichen Einsatz: In der Regel wird automatisierter Journalismus mit regelba- 
sierten Textalgorithmen umgesetzt (vgl. zum Einsatz in der Praxis Abschnitt 3.3). 
Deutlich wird aber, dass die Vorstellung von Künstlicher Intelligenz die Wahrneh- 
mung von Automatisierungen der Teilnehmenden prägt. 


Friedericke (32, Medien): Ich habe lustigerweise genau in die andere Richtung dazu 
etwas gehört. [...] man [denke] zwar immer [...], dass KI so weit sei, um Texte selbst 
zu schreiben oder morgen alleine Autos zu steuern. Aber die Entwicklung ist in der 
Realität bei weitem nicht so fortgeschritten. Da übertreiben die Medien gerne, wie 
weit die KI ist und in Wahrheit sind wir nicht so weit, sondern eher noch bei Adam 
und Eva. Also die KI ist noch nicht so weit und wir müssen keine Angst haben, es ist 
nicht wie bei Terminator. 00:09:49 


(Focus Group III, Pos. 39) 
Jan (32, Medien): Hm, an der Stelle fällt mir auf, dass nur wir alle von Kl angefangen 


und gesprochen haben. Eigentlich fragt Theresa [Anm.: die Interviewerin] nur nach 
automatisiertem Journalismus. Vielleicht sind wir dann zu weit gesprungen. 00:44:03 


(Focus Group III, Pos. 129) 


Die Einflüsse der Vorstellung über Verfahren der Künstlichen Intelligenz sind in 
die Vertrauensbewertungen mit eingeflossen, da die Teilnehmenden in der Regel 
nicht zwischen regelbasierten Algorithmen und Algorithmen, die mit Verfahren der 
Künstlichen Intelligenz arbeiten, unterscheiden. An mehreren Stellen, wie etwa bei 
der Vorstellung über Medienrezeptionen von Robotern und Künstlichen Intelligen- 
zen oder dem Versuch der Teilnehmenden, die Funktionsweise des automatisier- 
ten Journalismus zu erklären, wurden Einflüsse und Vorstellungen über Künstliche 
Intelligenzen diskutiert. Der Einfluss der Vorstellung und Wahrnehmung von Künst- 
licher Intelligenz und die individuellen Erfahrungen mit diesen Methoden müssen 
im Detail in Folgestudien aufgearbeitet werden. Aus den vorliegenden Ergebnissen 
kann die Vorstellung über Künstliche Intelligenz als weiterer Einflussfaktor auf die 
Wahrnehmung und Vertrauensbewertung des automatisierten Journalismus aufge- 
nommen werden. 
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Fazit 9 


Diese Studie untersucht die Vertrauensbewertung des automatisierten 
Journalismus — beziehungsweise des Journalismus als Ganzes, der teilweise mit 
Automatisierungen arbeitet — durch Lesende in Deutschland. Ziel der explora- 
tiven Arbeit ist es, die Wahrnehmung und Bewertung des Untersuchungsgegen- 
stands zu erheben, bereits untersuchte Einflussfaktoren auf die Wahrnehmung com- 
putergenerierter Stimuli zu vertiefen und weitere mögliche Einflussfaktoren der 
Vertrauensbewertung zu ermitteln. Dazu wird zunächst der Untersuchungsgegen- 
stand dargestellt, die Vertrauensforschung aufgearbeitet und der Forschungsstand 
zur bewerteten Glaubwürdigkeit computergenerierter Nachrichtentexte systemati- 
siert. Die Aufarbeitung dieser drei Forschungsbereiche dient der Kontextualisierung 
des Forschungsinteresses, der Operationalisierung des Vertrauensbegriffs sowie der 
systematischen Aufarbeitung möglicher Einflussfaktoren auf die Vertrauensbewer- 
tung. 

Adressiert wird das Forschungsziel in mehreren Forschungsfragen, die in drei 
Themenbereiche gegliedert sind: Im ersten Fragenkomplex geht es um die Wahrneh- 
mung des automatisierten Journalismus durch Lesende und die Bedeutung, die diese 
der computergenerierten Berichterstattung im Journalismus insgesamt zuschreiben. 
Im zweiten Fragenkomplex werden die Erwartungen der Teilnehmenden zum Ein- 
satz der Technologie diskutiert und die Erfüllung von vertrauensbildenden Maß- 
nahmen thematisiert. Im dritten Fragenkomplex werden die — sich aus dem For- 
schungsstand ergebenden — Einflussfaktoren auf die Vertrauenszuschreibung des 
automatisierten Journalismus untersucht. Dazu werden ausgewählte Personenmerk- 
male, Eigenschaften des Untersuchungsgegenstands sowie Publikations- und Text- 
merkmale automatisiert generierter Nachrichten geprüft und weitere Einflussfakto- 
ren exploriert. Zur Beantwortung der Forschungsfragen werden drei Focus Groups 
mit insgesamt 16 Teilnehmenden durchgeführt. Für Focus Group I (Durchschnitt) 
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wurden möglichst heterogene Teilnehmende rekrutiert, für Focus Group II (Tech- 
nologie) im hohen Maße technologieaffine Personen befragt und in Focus Group II 
(Medien) nehmen Personen mit hoher Medienkompetenz teil. 


9.1 Zusammenfassung der Ergebnisse 


Die Teilnehmenden der Focus Groups verwenden einen interpersonalen Vertrau- 
ensbegriff, der die theoretischen Bezüge des Begriffs widerspiegelt: Zentrale Merk- 
male von Vertrauensurteilen sind die damit verbundene Unsicherheit der Teilneh- 
menden, die fehlenden Informationen zur Vertrauensentscheidung und der Fokus 
auf zukünftige Ereignisse. Teilnehmende treffen Handlungsentscheidungen auf- 
grund ihrer Vertrauensurteile. Gegenüber Journalismus in Deutschland geben sie 
insgesamt mittleres bis hohes Vertrauen an. Zu Vertrauen in Journalismus wird 
eine Idealvorstellung von Journalismus beschrieben, an der sich die Bewertung der 
wahrgenommenen Leistung des Systems orientiert. Formuliert wird die Vorstel- 
lung, dass sich journalistische Akteur:innen integer verhalten, sich zur wahrheits- 
gemäßen Berichterstattung ohne Beeinflussung durch Dritte verpflichtet sehen und 
nach diesen Grundsätzen handeln. Die Teilnehmenden leiten diese Grundsätze von 
den Aufgaben und Funktionen von Journalismus ab, wenngleich in Focus Group 
I (Durchschnitt) und II (Technologie) teilweise ungenaue Vorstellungen über den 
journalistischen Nachrichtenproduktionsprozess vorherrschen. Sie alle beschreiben 
insgesamt einen generalisierten Vertrauensbegriff. Auch aufgrund der geringen Vor- 
kenntnisse zum automatisierten Journalismus sind das generalisierte Journalismus- 
vertrauen und Vertrauen in automatisierten Journalismus oder Vertrauen in Jour- 
nalismus, der teilweise mit automatisiertem Journalismus arbeitet, empirisch kaum 
voneinander abgrenzbar. Zudem überschneiden sich in der Empirie die verwende- 
ten Begriffe Vertrauen, Glaubwürdigkeit und wahrgenommene Qualität bezogen auf 
unterschiedliche journalistische Bezugsobjekte. 

Die Mehrheit der Teilnehmenden hat vor der Erhebung von der Existenz der 
computergenerierten Berichterstattung gehört. Bewussten Kontakt mit automati- 
siertem Journalismus hatten aber nur einzelne Teilnehmende (FF1.1). Beschrieben 
wird automatisierter Journalismus (FF1.2) als Möglichkeit, mit Hilfe von Algo- 
rithmen Texte im Journalismus zu generieren. Automatisierter Journalismus steht 
bei den Teilnehmenden vor allem für einfache, standardisierte Routinetexte, für die 
Berichterstattung zu wenig komplexen Themen und umgesetzt in standardisierten 
Darstellungsformen, wie etwa in kurzen Nachrichten. Insgesamt haben die Teil- 
nehmenden wenig Wissen über die Funktionsweise und Verbreitung des automa- 
tisierten Journalismus. Die Vorstellungen über die zugrundeliegende Technologie 
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sind breit gefächert und schwanken zwischen einfachen, regelbasierten Textgene- 
rierungsalgorithmen und komplexen Verfahren, die mit Hilfe von Verfahren der 
Künstlichen Intelligenz umgesetzt werden. Als Chance des automatisierten Journa- 
lismus beschreiben die Teilnehmenden eine aktuelle und schnelle Berichterstattung 
sowie möglicherweise frei werdende Ressourcen für Journalist:innen. Als Grenzen 
nehmen sie die Einordnung von Hintergründen, die Abwägung von Argumenten und 
die Textgenerierung in hochspezialisierten, komplexen Themen wahr. Besonderes 
Augenmerk in der Wahrnehmung legen die Teilnehmenden auf die Frage, welchen 
Anteil Verfahren der Künstlichen Intelligenz haben, welche Daten- und KI-Modelle 
zugrunde liegen und welche Art der menschlichen Kontrolle der generierten Texte 
stattfindet. 

Insgesamt bewerten die Teilnehmenden automatisierten Journalismus (FF1.2) 
als interessante und relevante Medieninnovation im Journalismus, wenngleich die 
vorgelegten Praxisbeispiele mehrheitlich als eher langweilig und einfach beschrie- 
ben wurden. Die Teilnehmenden äußern gegenüber dem Untersuchungsgegenstand 
sowohl Neugierde und positive Erwartungen als auch Skepsis und negative Erwar- 
tungen. Außerdem werden das mangelnde Wissen über den Einsatz der Technolo- 
gie, das Ausmaß der automatisierten Berichterstattung im Journalismus insgesamt 
sowie die technologische Funktionsweise und Kontrollmechanismen thematisiert. 
Neugierde und positive Erwartungen zeigen sich, indem eine mögliche Verbesse- 
rung von Routinetexten, neue Möglichkeiten der Berichterstattung und Vorteile, wie 
zielgruppenorientierte Berichte und Einbindung vielfältigerer Quellen und Perspek- 
tiven angesprochen wird. Deutlich skeptisch äußern sich die Teilnehmenden gegen- 
über automatisiertem Journalismus, wenn mögliche gesellschaftliche Auswirkun- 
gen der Automatisierung thematisiert werden. Eine Befürchtung ist beispielsweise, 
dass sich — aus Sicht der Teilnehmenden — wahrgenommene Probleme im Journalis- 
mus, wie die Diskussion um Fake News oder Echochamber-Phänomene, verstärken. 
Zudem werden Angst vor Manipulation durch automatisierte Textgenerierung und 
die Befürchtung, dass die Softwaresysteme zur öffentlichen Meinungsbildung von 
neuen Akteur:innen verwendet werden, die sich nicht an journalistische Werte und 
Normen halten, geäußert. Sowohl die positiven als auch die negativen Erwartungen 
werden teilweise sehr konkret formuliert, gelegentlich aber auch als diffuses Gefühl 
artikuliert. Deutlich machen die Teilnehmenden, dass sie ihre Anforderungen an 
einen transparenten Umgang mit automatisiertem Journalismus durch Medienver- 
antwortliche nicht erfüllt sehen (FF2.2). 

Die Teilnehmenden fordern (FF2.1) einen transparenten Einsatz des automa- 
tisierten Journalismus in Deutschland. Konkret verlangen sie eine Kennzeich- 
nung automatisiert oder hybrid erzeugter Nachrichtentexte, Regeln hinsichtlich 
verantwortlicher Personen und Maßnahmen zur Herstellung einer algorithmic 
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accountability, wie politische Regulierung, Kontrollinstanzen für automatisierte 
Systeme und Verpflichtungen zum ethisch verantwortungsvollen Einsatz der Tech- 
nologie. Möglicherweise ist mittel- und langfristig mit einem Gewöhnungseffekt 
der Lesenden im Umgang mit automatisierten Journalismus und damit weniger 
deutlich geäußerten Forderungen zu rechnen, aber in der aktuellen — von den Teil- 
nehmenden als Übergangsphase einer neuen Technologie beschriebenen - Situation 
(FF1.5) haben sie hohe Transparenzforderungen: Sie wollen mehr Informationen 
über die Funktionsweise der Textautomatisierung, den tatsächlichen Einsatz der 
Technologie im Journalismus, konkrete Anwendungsbeispiele und das Ausmaß der 
Textautomatisierung im deutschen Journalismus erhalten (FF2.2). 

Vertrauen in automatisierten Journalismus (FF1.3) wird in den drei Focus Groups 
unterschiedlich beschrieben: Die Teilnehmenden in Focus Group I (Durchschnitt) 
geben mehrheitlich eher wenig oder geringes Vertrauen in automatisierten Journa- 
lismus an. Nach intensiver Reflexion fallen die Vertrauensurteile der Teilnehmenden 
zwar differenzierter, aber weitestgehend ebenso kritisch und negativ aus. In Focus 
Group I (Technologie) überwiegt zunächst ein neutrales Vertrauensurteil gegenüber 
dem wahrgenommenen aktuellen Einsatz der journalistischen Textautomatisierung. 
Wenn die Teilnehmenden aber über mögliche technologische Weiterentwicklun- 
gen und den Einsatz von Verfahren der Künstlichen Intelligenz sprechen, fallen die 
Vertrauensurteile deutlich negativer aus. In Focus Group III (Medien) fallen die 
Äußerungen hinsichtlich des Vertrauens in automatisieren Journalismus überwie- 
gend neutral aus. Dieses Urteil beruht auf der Erwartungshaltung, dass automati- 
sierte Berichterstattung in redaktionelle Strukturen eingebunden ist und dementspre- 
chend eine angemessene Kontrolle durch Journalist:innen erfolgt. Insgesamt wird 
Vertrauen in automatisierten Journalismus damit in den Focus Groups unterschied- 
lich eingeschätzt. Kein Teilnehmender äußert totale Ablehnung oder große Eupho- 
rie gegenüber dem Untersuchungsgegenstand (FF1.5). Grundsätzlich zeigen die 
Teilnehmenden Offenheit, Neugierde, Skepsis und ein hohes Informationsbedürf- 
nis. Das wahrgenommene allgemeine Vertrauensklima wird deutlich skeptischer 
beschrieben (FF1.4) hier vermuten die Teilnehmenden mittelfristig wenig Interesse 
und ein eher sinkendes Vertrauen der Gesamtbevölkerung am Gegenstand. 

Als Einflussfaktoren der individuellen Ebene (FF3.1) werden die Technologie- 
affınität, eine hohe Medienkompetenz sowie die Rezeption von Roboterdarstellun- 
gen oder Erzählungen über Künstliche Intelligenzen in den Medien untersucht. Die 
Teilnehmenden mit hoher Technologieaffinität und hoher Medienkompetenz zeigen 
sich mehrheitlich neutral gegenüber automatisiertem Journalismus, insbesondere 
wenn es um aktuellen Einsatz der Technologie geht und sind skeptisch gegenüber 
künftigen Entwicklungen. Unter den technologieaffinen Teilnehmenden wird ins- 
besondere der verstärkte Einsatz von Verfahren der Künstlichen Intelligenz kritisch 
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betrachtet. Deutlich negativ äußern sich die medienkompetenten Teilnehmenden 
gegenüber gesellschaftlichen Auswirkungen im Journalismus, wenn die Technolo- 
gien von Akteur:innen verwendet werden, die nicht in professionelle journalistische 
Kontexte eingebunden sind. Zusätzlich wird der Roboterdarstellung und der Darstel- 
lung von Künstlichen Intelligenzen ein hoher Einfluss auf die Vertrauensbewertung 
des automatisierten Journalismus zugeschrieben: In allen Focus Groups geben Teil- 
nehmende an, dass sie selbst — beziehungsweise die Bevölkerung — diese Medienre- 
zeptionen als eine Grundlage ihres Vertrauensurteils nutzen, indem sie anhand der 
Medienrezeptionen ihr begrenztes Wissen zum Untersuchungsgegenstand ausglei- 
chen. Schwierig, so die Teilnehmenden, ist es, dass Roboter und Künstliche Intelli- 
genzen oft als negativ und bedrohlich beschrieben sowie in dystopischen Kontexten 
dargestellt werden. 

Als spezifische Merkmale des automatisierten Journalismus (FF3.2) und als 
Einflussfaktoren auf eine geringere Vertrauensbewertung des Untersuchungsgegen- 
stands werden die fehlenden Kennzeichnungsregelungen, das insgesamt geringe 
Wissen über automatisierte journalistische Berichterstattung sowie die steigende 
Komplexität des Nachrichtenproduktionsprozesses thematisiert. Die Teilnehmen- 
den nehmen an, dass es für sie — und die Bevölkerung insgesamt — noch schwieriger 
wird, den journalistischen Produktionsprozess nachvollziehen und Textautomati- 
sierung einordnen zu können. Sie gehen weiterhin davon aus, dass die steigende 
Komplexität der Nachrichtenentstehung mehrheitlich das Vertrauen der Bevölke- 
rung in Journalismus sinken lässt. 

Als Publikations- und Textmerkmale (FF3.3) werden die Kennzeichnung der 
Texte, das Nachrichtenthema, die journalistische Stil- und Darstellungsform sowie 
die Publikation, in der die automatisiert generierten Texte erscheinen, angespro- 
chen. Grundsätzlich gelten als automatisiert generiert gekennzeichnete Nachrich- 
ten ebenso vertrauenswürdig wie journalistisch verfasste Texte. Zunächst scheinen 
das Thema und die Darstellungsform einen großen Einfluss auf die bewertete Ver- 
trauenswürdigkeit zu haben — beziehungsweise die Teilnehmenden nutzen beide 
Merkmale, um Vertrauen in automatisierten Journalismus bei bestimmten Themen 
oder komplexen Darstellungsformen, wie Kriegsberichterstattung oder Reportagen, 
für sich auszuschließen. Im weiteren Gesprächsverlauf zeigt sich aber, dass weniger 
das Thema oder die Darstellungsform sondern vielmehr eine wahrgenommene Kon- 
tingenz der Texte und möglichen Kontingenzentscheidungen, die ein Algorithmus 
trifft, ausschlaggebend für die Vertrauensurteile sind. Für die Lesenden ist entschei- 
dend, ob ein Algorithmus eigenverantwortlich relevante Entscheidungen im Text 
trifft. Darunter zählt beispielsweise die Darstellung verschiedener Meinungen, die 
Auswahl von Argumenten oder die Bewertung eines Ereignisses. Wenn ein Algo- 
rithmus solche Entscheidungen trifft, dann sinkt das Vertrauen der Lesenden in die 
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Nachricht. Zusätzlich konnte ein Zusammenhang zwischen einer vertrauenswür- 
digen Publikation oder Medienquelle und einem als vertrauenswürdig bewerteten 
automatisiert generierten Text festgestellt werden: Die Befragten nehmen an, dass 
ein vertrauenswürdiges Medium einen verantwortungsvollen Einsatz des automati- 
sierten Journalismus pflegt. Deshalb bewerten sie einen dort veröffentlichten auto- 
matisierten Text als vertrauenswürdig. 

Das Ziel der vorliegenden Arbeit ist zudem die Exploration weiterer Einflussfak- 
toren (FF3.4) auf die Vertrauensbewertung der Lesenden in automatisierten Journa- 
lismus: Hier werden die angesprochene Kontingenzentscheidung oder eigenständige 
Einordnung von Ereignissen durch Algorithmen als entscheidende Faktoren wahr- 
genommen. Auch die Vorstellung über Künstliche Intelligenzen und das Wissen über 
die Technologie beeinflusst die Vertrauensurteile der Lesenden. Außerdem scheint 
die Intention der Textauswahl — unter der Voraussetzung gekennzeichneter Texte — 
zwischen menschlich verfassten und automatisiert generierten Texte für Vertrauen 
relevant zu sein: Bei ausgewählten Themen und Darstellungsformen geben Lesende 
an, dass sie automatisiert generierte Texte den journalistisch verfassten Nachrichten 
vorziehen und ihnen ein höheres Vertrauen zuschreiben würden. Wichtig für Ver- 
trauensurteile ist also die Intention der Lesenden, mit der sie eine Auswahl zwischen 
menschlich verfassten und automatisiert generierten Texten treffen (vgl. ausführlich 
Kapitel 8). 


9.2 Einordnung der Ergebnisse, Limitationen und 
weiterführende Forschung 


Ausgangspunkt dieser Arbeit ist die These, dass die Kommunikationswissenschaft 
die Perspektive der Lesenden im automatisierten Journalismus intensiver untersu- 
chen muss, um die Wahrnehmung, den Umgang und die Vertrauensbewertung der 
Medieninnovation zu berücksichtigen, die mittel- und langfristig Journalismus in 
Deutschland verändern wird. Ein Mindestmaß an Vertrauen der Bevölkerung in 
Journalismus ist wichtig für die Stabilität von demokratischen Gesellschaften und 
Vertrauen ist weiterhin das geeignete Konstrukt für die Forschung zum Umgang 
mit neuen Technologien, mit Unsicherheiten und fehlendem Wissen, mit Blick auf 
zukünftige Entwicklungen und losgelöst von einzelnen Textartefakten. Zu diesem 
Forschungsinteresse wurden in Abschnitt 6.1 wesentliche Lücken in der bisherigen 
Forschung dargelegt: Defizite in der Forschung zur Wahrnehmung computergene- 
rierter Nachrichten sowie Lücken in der kommunikationswissenschaftlichen Ver- 
trauensforschung und deren Modellentwicklung. Am Ende dieser Arbeit soll im 
Folgenden geprüft werden, welche Lücken bearbeitet werden konnten. Zudem soll 
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kritisch reflektiert werden, welchen Limitationen diese Studie unterliegt, welche 
Defizite bestehen bleiben und welche Anregung diese Arbeit für Folgestudien leis- 
ten kann. 


Einordnung der Studienergebnisse 
Die erste Forschungslücke betrifft die Wahrnehmung des automatisierten Jour- 
nalismus. Hier fehlt im Forschungsstand neben den quantitativen Befunden zur 
Wahrnehmung, die sich eng an den vorgelegten Stimulitexten orientieren und die 
Glaubwürdigkeit von computergenerierten Nachrichtentexten erhoben haben, ein 
qualitativer, offener und flexibler Zugang (vgl. Tandoc Jr. et al. 2020: 559). Die vor- 
liegende Studie kann mit den Focus Groups Erkenntnisse zu den Vorstellungen der 
Teilnehmenden über automatisierten Journalismus sowie Ergebnisse zur Beschrei- 
bung und Bewertung des Untersuchungsgegenstands gewinnen. Dazu beschreiben 
die Teilnehmenden unter anderem ihre Erwartungen an den Technologieeinsatz und 
stellen konkrete Forderungen gegenüber Medienverantwortlichen zum transparen- 
ten Einsatz des automatisierten Journalismus. Sie tauschen sich außerdem über 
mögliche Chancen und Grenzen der Technologie aus und verbalisieren Emotionen, 
wie Neugierde und Interesse, aber auch Skepsis und Angst gegenüber dem Ein- 
satz im Journalismus. Insgesamt stehen die Teilnehmenden dem automatisierten 
Journalismus mehrheitlich neutral gegenüber, fordern aber von den Medienverant- 
wortlichen Transparenz beim Einsatz der computergenerierten Berichterstattung. 
Mehrfach werden in den Gesprächen Ideen der Teilnehmenden im gegenseitigem 
Austausch weiterentwickelt und offene Fragen aufgeworfen. Die Focus Groups wer- 
den erst beendet, als keine Person weitere Impulse zum Thema beitragen konnte. 
Diese Studie leistet damit die Exploration der Wahrnehmung des automatisier- 
ten Journalismus in Deutschland im Jahr 2022 und kann als Grundlage für wei- 
tere Forschung zum Umgang der Lesenden mit computergenerierter Berichterstat- 
tung dienen. Neben den Studiendaten, die Zusammenhänge zwischen ausgewählten 
Einflussfaktoren und der Wahrnehmung bestätigen, werden weitere Faktoren the- 
matisiert, die bisher nicht berücksichtigt wurden. Dazu gehören zum Beispiel die 
Intention bei der Textauswahl oder die Kontingenz eines Nachrichtentexts. Weiter- 
hin liefert die Studie die Exploration der Vertrauensbewertung des automatisierten 
Journalismus beziehungsweise von Journalismus, der teilweise mit Textautomatisie- 
rungen arbeitet. Auch dazu können einige theoretische Annahmen über Einflussfak- 
toren bestätigt und zusätzliche Einflussfaktoren genannt werden. Als Vorbereitung 
der vorliegenden Arbeit werden die Studien zur wahrgenommenen Glaubwürdig- 
keit computergenerierter Nachrichtentexte systematisch und detailliert aufgearbei- 
tet. Diese umfassende Aufarbeitung thematisiert zusätzlich mögliche Einflussfakto- 
ren, die aber im Rahmen dieser Arbeit nicht bearbeitet werden konnten. Dazu zählen 
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ein Ländervergleich und der Einfluss des jeweiligen Mediensystems, der kulturelle 
Hintergrund oder sehr hohes oder sehr niedriges Medienvertrauen der Lesenden. 
Es gibt weiterhin keine Studien, in denen der Umgang der Lesenden mit hybriden 
Nachrichtentexten oder der Einfluss einer möglichen Diskrepanz aus Erwartungen 
und Wahrnehmungen an computergenerierte Nachrichtentexte intensiv bearbeitet 
wird. 

Zusätzlich werden auch in der kommunikationswissenschaftlichen Vertrauens- 
forschung Forschungslücken herausgearbeitet: So fehlen weitere Arbeiten zur Veri- 
fikation der bislang erhobenen Einflussfaktoren auf Journalismus- und Medienver- 
trauen. Zudem kann die Sammlung der generierten Einflussfaktoren als nicht abge- 
schlossen gelten. Außerdem fehlt Forschung zum Umgang mit Medieninnovationen 
und dem Einfluss, der sich daraus auf Vertrauenszuschreibungen der Lesenden in 
Journalismus ergibt. Weiterhin untersucht die Vertrauensforschung häufig Perso- 
nen mit niedrigen Vertrauensniveaus, dabei gibt die Mehrheit der Bevölkerung in 
Deutschland mittleres Vertrauen in Journalismus an. Es fehlen demnach Studien, 
die gezielt Personen mit mittlerem Medienvertrauen untersuchen und beispielsweise 
erheben, was mittleres Vertrauen für die Lesenden bedeutet (vgl. Prochazka 2020: 
269f.). Zusammenfassend kann man festhalten, dass mit den Ergebnissen der vor- 
liegenden Arbeit mehrere Erkenntnisse der Vertrauensforderung bestätigt werden 
können: Die Teilnehmenden haben sowohl interpersonales Vertrauen als auch Ver- 
trauen in Journalismus so definiert, wie es die Vertrauensforschung konzeptioniert 
hat und es wurden keine weiteren Merkmale oder Bedingungen ergänzt. Als rele- 
vanter Einflussfaktor der Vertrauensbewertung des Journalismus wird auch in dieser 
Studie insbesondere das Gefühl der gezielten Manipulation thematisiert. Außer- 
dem wird der Einfluss des individuellen Wissens über Journalismus und journalisti- 
sche Nachrichtenproduktion auf die Vertrauensbewertung auch in der vorliegenden 
Arbeit nachvollzogen. Die Studie verbindet zudem den stark praxisgetriebenen For- 
schungsbereich zum automatisierten Journalismus mit der bestehenden Forschung 
zu Vertrauen in Journalismus. Damit kann zum einen die Forschung zur Wahrneh- 
mung der computergenerierten Berichterstattung durch Lesende stärker an das theo- 
retische Fundament im Fach angebunden werden. Zum anderen kann die Vertrau- 
ensforschung um den Umgang mit und die Wahrnehmung von Automatisierungs- 
und Innovationsprozessen durch das Publikum erweitert werden. Hier zeigen die 
Ergebnisse dieser Studie, dass im Umgang mit Medieninnovationen Personen- 
merkmale, wie zum Beispiel Technologieaffinität, Vorstellungen über Künstliche 
Intelligenzen oder die steigende Komplexität der Nachrichtenproduktion, zusätzli- 
che Einflussfaktoren auf die Vertrauensbewertung darstellen, die in den Modellen 
zum Vertrauen der Lesenden in Journalismus berücksichtigt werden müssen. Mit 
der Verbindung beider Forschungsbereiche schafft die vorliegende Arbeit zudem 
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eine Systematisierung beider Themen, die einige Unübersichtlichkeiten — beispiels- 
weise in der komplexen Vertrauensforschung und der Operationalisierung von 
Vertrauensbeziehungen — auflösen kann und damit Folgestudien einen Rückgriff 
auf Vertrauensmodelle erleichtert. 

Das angesprochene dritte Forschungsdefizit bezieht sich auf die kommunikati- 
onswissenschaftliche Modellentwicklung zur Konzeption von Vertrauen in Jour- 
nalismus. Thematisiert wird der fehlende Bezug der bestehenden Modelle zu 
Medienwandel- und Medieninnovationsprozessen und ihrem Einfluss auf die Per- 
spektive der Lesenden. Außerdem gibt es keine Modelle im Forschungsstand, die 
eine Entstehung oder Veränderung von Vertrauensbewertungen sowie die Stabilität 
von Vertrauensurteilen berücksichtigen. Zudem wird festgestellt, dass das erho- 
bene Vertrauen auch von der Art der Fragestellung abhängt und weitere Studien mit 
unterschiedlichen Erhebungsmethoden und Studiensettings für eine Verifikation der 
bisherigen Erkenntnisse notwendig sind (vgl. Prochazka 2020: 270). Zusammen- 
fassend zeigen die Ergebnisse der vorliegenden Arbeit, dass bestehende Vertrauens- 
modelle um weitere Einflussfaktoren, insbesondere im Umgang mit Medieninno- 
vationen und Transformationsprozessen, ergänzt werden müssen. Zur Stabilität der 
Vertrauensurteile kann diese Arbeit durch das Querschnittsdesign wenig beitragen. 
Hier sei auf die notwendige Durchführung von Langzeitstudien verwiesen. 


Limitationen der vorliegenden Studie 

Die Studie weist zahlreiche Einschränkungen auf, die zur Einordnung der Stu- 
dienergebnisse und zur Vorbereitung von Folgestudien berücksichtigt werden müs- 
sen. Auf die Limitation des Samples und der Rekrutierung wurde bereits hinge- 
wiesen: Rekrutiert wurden gezielt nur Personen mit mittleren Vertrauensniveaus, 
die zudem Deutsch auf Muttersprachniveau sprechen und in der Bundesrepublik 
leben. Ein häufiges Problem in der empirischen Forschung ist die wenig diverse 
Zusammensetzung von Befragungssamples. Häufig sind Personen mit hohem Bil- 
dungsgrad und — bei Online-Verfahren — jüngere, medienkompetente und online- 
affıne Teilnehmende überdurchschnittlich häufig repräsentiert. Beides trifft auch auf 
die vorliegende Studie zu: So liegt das Bildungsniveau im Sample deutlich höher 
als der Durchschnittswert der deutschen Bevölkerung und insgesamt haben über- 
durchschnittlich viele Menschen unter 50 Jahren teilgenommen. Wie angesprochen 
arbeitet die vorliegende Studie zunächst systematisch mögliche Einflussfaktoren 
auf die Wahrnehmung des automatisierten Journalismus aus dem Forschungsstand 
zur bewerteten Glaubwürdigkeit computergenerierter Nachrichten auf. Hier wur- 
den eine Reihe von Einflussfaktoren gesammelt, die in dieser Arbeit durch das 
gezielte Sampling nicht bearbeitet werden können. Durch die Rekrutierung von 
ausschließlich deutschen Teilnehmenden ist ein Vergleich der Vertrauensbewertung 
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in mehreren Ländern, der Einfluss des jeweiligen Mediensystems auf die Wahrneh- 
mung oder ein unterschiedlicher kultureller Hintergrund der Teilnehmenden nicht 
möglich. Insgesamt nehmen 16 Personen in drei Focus Groups teil, die gezielt für 
die Zusammensetzung der Gruppen rekrutiert werden. Dieses Sample ist für die 
Exploration der Vertrauensbewertung ausreichend, von einer Generalisierung oder 
Repräsentativität der Studienergebnisse kann aber nicht gesprochen werden. 

Die Studie arbeitet mit einem Querschnittsdesign, daher können keine Kausalbe- 
ziehungen zwischen Einflussfaktoren untersucht oder festgestellt werden. Sie kann 
auch weder die Stabilität noch eine Veränderung von Vertrauensurteilen im Zeit- 
verlauf nachvollziehen, dazu sind Längsschnittdesigns notwendig. Außerdem sind 
Focus Groups reaktive Forschungsmethoden, das heißt die Teilnehmenden stehen 
in direktem Kontakt mit der Interviewerin oder dem Interviewer. Daher muss — ins- 
besondere bei Themen, welche die Werte und Normen einer Gesellschaft oder die 
Intimsphäre der Teilnehmenden behandeln, der Effekt der sozialen Erwünschtheit 
berücksichtigt werden: Insbesondere bei reaktiven Erhebungsmethoden äußern sich 
die Befragten häufig wie sozial erwünscht und formulieren Aussagen, von denen sie 
glauben, dass die Interviewer:innen oder die Gruppe diese von ihnen erwartet (vgl. 
Brosius et al. 2016: 92 f.). Dieser Effekt tritt in der vorliegenden Arbeit bei der Frage 
nach der Relevanz, welche die Teilnehmenden der computergenerierten Berichter- 
stattung im Journalismus insgesamt zuschreiben, auf: Hier spricht die Mehrheit der 
Teilnehmenden zunächst von einer sehr hohen Relevanz des automatisierten Journa- 
lismus auf ihre Vertrauensbewertung in Journalismus. Nach der direkten Abfrage hat 
die Interviewerin dann eine so genannte Projektionsfrage (vgl. ebd.: 93) zum selben 
Thema gestellt und gefragt, wie die Teilnehmenden die Meinung ihrer Bekannten 
oder der Durchnittsbevölkerung zur Relevanz des Untersuchungsgegenstands ein- 
schätzen. Die Antworten auf die Projektionsfrage fallen deutlich skeptischer aus — 
die Teilnehmenden glauben, dass der automatisierte Journalismus für die meisten 
Deutschen eher keine Relevanz hat. Damit muss vor allem bei dieser Frage vom 
Effekt der sozialen Erwünschtheit ausgegangen werden. 

Insgesamt kann die vorliegende Arbeit einige theoretische Annahmen über Ver- 
trauen in Journalismus bestätigen und eine erste Exploration der Vertrauensbewer- 
tungen der Lesenden in automatisierten Journalismus leisten. Zudem kann die Wahr- 
nehmung des automatisierten Journalismus exploriert und einige bekannte Zusam- 
menhänge vertieft betrachtet werden. Deutlich wird, dass es keine einfache und 
monokausale Antwort auf die Frage nach dem Vertrauen der Lesenden in automa- 
tisierten Journalismus geben kann: Es gibt nicht ein Publikum, sondern disperse 
Publika, was unterschiedliche Zugänge der Personen zum Gegenstand bedeutet. 
Automatisierter Journalismus ist zudem ein komplexes und sich kontinuierlich ver- 
änderndes Konstrukt, das beispielsweise mit dem verstärkten Einsatz von Verfahren 
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der Künstlichen Intelligenz um weitere Dimensionen ergänzt wird. Und schlussend- 
lich ist auch die Vertrauensforschung von einer Komplexität der Konstrukte geprägt 
und durch sich überlappende Begriffe, Objekte und Beziehungen gekennzeichnet. 
Es gibt also keine einfache Antwort auf die Vertrauensfrage, aber den deutlichen 
Hinweis darauf, dass die Forschung zu Medieninnovationen an die bestehenden 
Modelle des Fachs angebunden werden muss, damit nachhaltig fundierte Ergebnisse 
zur Wahrnehmung und Perspektive der Lesenden erzielt werden können. Die vorlie- 
gende Studie ergänzt das stark praxisgetriebene Forschungsfeld des automatisierten 
Journalismus um die theoretische Fundierung und den Rückbezug zur kommuni- 
kationswissenschaftlichen Vertrauensforschung und ihrer Modelle. Dazu werden 
beide Forschungsbereiche systematisch aufgearbeitet und in der Empirie zusam- 
mengeführt. Diese Systematisierung kann in Folgestudien genutzt werden, um zum 
Beispiel Vertrauen in automatisierten Journalismus in Bezug zu spezifischen Ver- 
trauensobjekten zu erforschen. Insgesamt konnten einige Forschungslücken bear- 
beitet und eine Aufarbeitung beider Forschungsbereiche als Grundlage für weitere 
Arbeiten vorgelegt werden. Dennoch bleiben Lücken in der Forschung zu Vertrauen 
in Journalismus in Verbindung mit Prozessen des Medienwandels und Defizite in 
der Forschung zum automatisierten Journalismus. 


Impulse für die weitere Forschung 

Die Ergebnisse dieser Arbeit können als Grundlage für weitere Forschung zur Wahr- 
nehmung und Vertrauensbewertung des automatisierten Journalismus dienen: In 
quantitativen Settings müssen die explorierten Einflussfaktoren mit einer größeren 
Stichprobe untersucht und die Generalisierbarkeit der Aussagen getestet, verifiziert 
und weiterentwickelt werden. Auch die qualitative Anschlussforschung ist notwen- 
dig, um beispielsweise die Stabilität der Vertrauensurteile zu prüfen sowie mögli- 
che weitere Einflussfaktoren und Wechselwirkungen zwischen Merkmalen aufzude- 
cken. Zudem wird der Einfluss enttäuschter Erwartungen auf die Vertrauensbewer- 
tung thematisiert (vgl. Abschnitt 4.2.3). Mögliche Enttäuschungen könnten — bei- 
spielsweise nach einer anfänglichen Neugierde und Euphorie die Wahrnehmung der 
Lesenden auf automatisierten Journalismus beeinflussen. Vielversprechend scheint 
zudem ein breiterer Methodenmix zur Erforschung der Wahrnehmung und Ver- 
trauensbewertung von Medieninnovationsprozessen im Journalismus zu sein: Mit 
Methoden, die eine stärkere Reflexion der individuellen Vertrauensurteile ermög- 
lichen — wie beispielsweise mittels ‚lautem Denken‘! - kann möglicherweise das 


! Lautes Denken ist eine qualitative und offene Erhebungsmethode: Die Befragten lösen eine 
definierte Aufgabe und verbalisieren während der Bearbeitung ihre Gedanken und die Vorge- 
hensweise (vgl. Bilandzic 2017: 406 ff.). In Zusammenhang mit automatisiertem Journalismus 
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Forschungsdefizit zur Entstehung oder Entwicklung von Vertrauensurteilen verrin- 
gert werden. 

Die vorliegende Studie konzentriert sich auf ein generalisiertes Vertrauensob- 
jektim automatisierten Journalismus. Zusätzlich sind aber noch Studien notwendig, 
die sich mit den in der Praxis tatsächlich verwendeten Stimulitexten und spezifi- 
schen Vertrauensobjekten beschäftigen. So kann der Umgang der Lesenden mit 
gekennzeichneten automatisiert generierten Texten besser und intensiver nachvoll- 
zogen werden. Es gibt zum Beispiel keine Forschung zu Fragen wie: Wie gehen 
Lesende konkret mit Textstimuli um? Wie bewerten sie die angegebenen Infor- 
mationen zu den Hintergründen der Automatisierung? Welcher Textquelle wenden 
sie sich bei welchem Thema und welcher Darstellungsform tatsächlich zu? Wie 
agieren die Lesenden mit den Texten und welche Konsequenzen für ihre Vertrau- 
ensurteile ergeben sich, wenn sich ein computergenerierter und ein journalistisch 
verfasster Text widersprechen? Wie gehen Lesenden mit offensichtlichen Fehlern 
oder falschen Informationen in computergenerierten Nachrichten um? Die Ergeb- 
nisse dieser Arbeit zeigen, dass die Intention der Lesenden bei der Textauswahl und 
die Kontingenz von Nachrichten eine Rolle in der Bewertung des automatisierten 
Journalismus spielt. Unklar bleibt aber, in welchem Umfang und in welcher Art 
beide Kriterien Einfluss auf die Vertrauensbewertung haben. 

Im Dezember 2022 hat das US-Unternehmen OpenAl den Chatbot ChatGPT 
veröffentlicht (vgl. Kapitel 1) und mit weiteren Programmen des Unternehmens 
können auch längere Texte erzeugt werden (vgl. Abschnitt Anwendungsbeispiel 
Anic T. Wae). Mit der Veröffentlichung dieser einfach zugänglichen Methoden zur 
automatisierten Textgenerierung ist ein Technologiesprung zu beobachten, der mög- 
licherweise den Einsatz des automatisierten Journalismus in Deutschland deutlich 
verstärkt. Dieser Technologiesprung und die intensivere Einbindung von Verfah- 
ren der Künstlichen Intelligenz im automatisierten Journalismus müssen auch in 
der Forschung berücksichtigt werden, insbesondere da diese Arbeit zeigt, dass die 
Vorstellungen der Lesenden über KI-Anwendungen einen Einfluss auf ihre Vertrau- 
ensbewertung in Journalismus hat. 


könnten die Befragten beispielsweise auf Basis von Informationen aus computergenerierten 
Nachrichtentexten eine Aufgabe bearbeiten und dabei ihre Denk- und Verarbeitungsprozesse 
verbalisieren (vgl. dazu z.B. auch Freiling 2019: 479 ff.). 
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9.3 _Handlungsempfehlungen für die Praxis 


Aus den empirischen Ergebnissen dieser Arbeit lassen sich Handlungsempfehlun- 
gen für die Praxis ableiten, die im Folgenden kurz zusammen mit den jeweiligen 
Akteur:innen angesprochen werden. Diese Empfehlungen zielen aus einer norma- 
tiven Perspektive darauf ab, einen informierten und kritisch-reflexiven Umgang 
der Lesenden mit automatisiertem Journalismus zu erreichen. Das Publikum soll 
ein Mindestmaß Vertrauen in automatisierte Berichterstattung entwickeln können, 
beziehungsweise soll der Einsatz von automatisierter Berichterstattung zumindest 
nicht zu sinkendem Vertrauen in Journalismus beitragen. 


Medienorganisationen: Transparenz herstellen 

Das wiederkehrende und deutlich geäußerte Motiv in der Wahrnehmung, Bewertung 
und Vertrauenszuschreibung des automatisierten Journalismus ist die Forderung der 
Lesenden nach mehr Transparenz beim Einsatz der computergenerierten Bericht- 
erstattung. Sie fordern als solche gekennzeichnete automatisiert oder hybrid gene- 
rierte Texte, mehr Informationen zum Einsatz und zur Verbreitung der Verfahren 
im deutschen Journalismus sowie Hintergrundinformationen zu den verwendeten 
Algorithmen. In den Focus Groups äußern die Teilnehmenden Unverständnis über 
die fehlende Kennzeichnung, vor allem da sie den Verfahren zunächst überwiegend 
neutral und neugierig gegenüberstanden. Diese deutliche Forderung nach Transpa- 
renz gilt für die Teilnehmenden vor allem in der aktuellen Einführungsphase der 
Medieninnovation. 

Dabei haben sie unterschiedliche Vorstellungen darüber, was Transparenz für 
sie bedeutet. Bereits in dem eng gefassten Sample der vorliegenden Studie werden 
disperse Publika deutlich: Es sind heterogene Rezipierende, die ein unterschied- 
liches Informationsbedürfnis hinsichtlich des automatisierten Journalismus haben 
und auch unterschiedliche Anforderungen an einen transparenten Umgang stellen. 
Für Medienorganisationen ist also eine mehrstufige Bereitstellung von Informatio- 
nen unterschiedlicher Tiefe empfehlenswert: Als Grundlage gilt die Kennzeichnung 
aller automatisiert generierten oder hybrid verfassten Texte. Zusätzlich sollten wei- 
terführende Informationen und Hintergrundberichte für Personen zur Verfügung 
stehen, die ein höheres Informationsbedürfnis haben. 

Der hohen Relevanz, die Lesende dem transparenten Umgang zuschreiben, liegt 
die Befürchtung zugrunde, durch automatisierte Kommunikation gezielt manipu- 
liert zu werden. Dieses Gefühl ist - auch ohne automatisierte Berichterstattung - ein 
starker Einflussfaktor auf sinkendes Medienvertrauen (vgl. Prochazka 2020: 159). 
Um dem Vorwurf der gezielten Manipulation zu entgehen, sind sowohl Aufklä- 
rung über journalistische Produktionsprozesse als auch Transparenz bei Fehlern in 
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Medienorganisationen gegenüber dem Publikum wichtig. Außerdem sollten halt- 
lose Vorwürfe wie die der gezielten Manipulation (vgl. Steindl 2021) entschieden 
zurückgewiesen werden (vgl. Prochazka 2020: 276 £.). Auch die Ergebnisse der vor- 
liegenden Studie zeigen, dass Lesende im automatisierten Journalismus die größte 
Skepsis gegenüber dem Einsatz von Textautomatisierungen haben, wenn sie vermu- 
ten, dass sie dadurch gezielt manipuliert werden sollen. Verstärkt wird diese Angst 
noch, wenn Künstliche Intelligenzen eingesetzt werden. 

Insgesamt wird die journalistische Nachrichtenproduktion durch die automati- 
sierte Textgenerierung komplexer und die Anforderungen an die Medienkompetenz 
der Lesenden steigt, um automatisierten Journalismus beurteilen zu können. Deshalb 
ist ein transparenter Umgang mit automatisiert generierten Texten und Aufklärung 
über den Einsatz der Textgenerierungsalgorithmen durch die Verantwortlichen in 
den Medienunternehmen notwendig für das Vertrauen der Lesenden in automati- 
sierten Journalismus. 


Publikum: Eigenverantwortung und gesellschaftliche Bildungsaufgabe 

Neben der Verantwortung, welche die Medienorganisationen für einen werteori- 
entierten Einsatz des Automatisieren Journalismus tragen, sprechen die Teilneh- 
menden in den Focus Groups auch die Eigenverantwortung der Rezipierenden im 
Umgang mit Journalismus an: Journalistische Inhalte müssen kritisch rezipiert wer- 
den, unabhängig davon, ob der Text eine menschlich verfasste oder eine computer- 
generierte Nachricht ist. Die Eigenverantwortung des Publikums, das heißt eine „ge- 
genseitige[] Wertschätzung von Journalismus und Zivilgesellschaft bei gleichzeitig 
kritischer Beobachtung“ (vgl. ebd.: 279) ist auch für den Umgang mit automatisiert 
generierten Nachrichten unabdingbar. 

Wie in dieser Arbeit mehrfach angesprochen, ist die Medienkompetenz, die 
notwendig ist, um automatisiert generierte Nachrichtentexte kritisch rezipieren zu 
können, höher als in der bisherigen Nachrichtenproduktion ohne Einsatz von Text- 
generierungsalgorithmen. Die Verantwortung, sich diese Kompetenz anzueignen, 
liegt bei den einzelnen Rezipient:innen. Gleichzeitig haben Medienorganisationen 
sowie gesellschaftliche Bildungsinstitutionen die Aufgabe, für Lesende die Mög- 
lichkeiten zu schaffen, sich diese Kompetenzen anzueignen. Dazu braucht es, wie 
angesprochen, gekennzeichnete Texte sowie weitere Möglichkeiten, den Umgang 
mit automatisierter Berichterstattung ausprobieren zu können: Eine Teilnehmerin 
spricht zum Beispiel davon, dass sie zu einem kritischen Nachrichtenthema zum 
Vergleich gerne einen menschlich verfassten und einen computergenerierten Text 
lesen möchte. Weiterhin wurde in den Focus Groups auch diskutiert, dass Lesende 
zum Vergleich gerne computergenerierte Kommentare und Glossen lesen und die 
Rezeption ausprobieren möchten. Insgesamt sollte Medienkompetenz im Umgang 
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mit automatisiertem Journalismus und Informationen über dessen Existenz und 
seine Einsatzmöglichkeiten möglichst niedrigschwellig — zum Beispiel integriert 
in schulische Bildungsangebote, wie „Zeitung in der Schule“ — vermittelt werden. 

Die Verfasserin appelliert daher an Medienorganisationen, die automatisier- 
ten Journalismus verwenden, sowie gesamt-gesellschaftliche Bildungsinstitutionen, 
Möglichkeiten zu schaffen, damit Lesende bewusste Erfahrungen im Umgang mit 
automatisiertem Journalismus erwerben können. Mittelfristig soll damit ein kritisch- 
reflexiver Umgang der Lesenden mit automatisiertem Journalismus gepflegt werden. 
In der Eigenverantwortung der Lesenden liegt es, diese Angebote wahrzunehmen 
und sich mit computergenerierter Berichterstattung und den Veränderungen im Jour- 
nalismus auseinanderzusetzen. 


Medienorganisationen und Gesellschaft: Dialog über Journalismus 

Der Veränderungsprozess im Journalismus, der unter anderem durch automati- 
sierte Textgenerierung angestoßen wird, bietet sowohl für privatwirtschaftliche 
und öffentlich-rechtliche Medienorganisationen als auch für die Zivilgesellschaft 
die Chance, mit verschiedenen Publika in einen konstruktiven Austausch über die 
Zukunft, die Ausgestaltung und den Wert von Journalismus zu treten (vgl. Dia- 
kopoulos 2019: 13; Loosen und Solbach 2020: 198; C.-G. Linden 2017a: 60). Ein 
solcher Dialog ist für Medienorganisationen wichtig, um Bedürfnisse, Wünsche und 
Forderungen der Lesenden zu kennen und eine intensive Nutzer:innenbindung zu 
erzielen. Die Zivilgesellschaft profitiert von diesem Austausch, wenn die Bevölke- 
rung dadurch ein klares Verständnis der Aufgaben, Strukturen und des Wertes von 
Journalismus entwickelt, journalistische Leistungen honorieren und Journalismus 
mit einer hohen Medienkompetenz kritisch begleiten kann. 

Ein Momentum für einen solchen Dialog entsteht, wenn Veränderungs- und 
Transformationsprozesse bestehende Vorgehensweisen und Produkte herausfordern 
und einer intensiven Prüfung unterziehen. Durch endogene und exogene Faktoren 
wird in Transformationsprozessen radikal geprüft, welche Prozesse automatisiert, 
verändert oder ersetzt werden können. Die Auseinandersetzung mit diesen Verän- 
derungsprozessen und die Gegenüberstellung von ‚klassischem Journalismus‘ und 
beispielsweise automatisiertem Journalismus kann zu einer Neupositionierung und 
Neudefinition von Journalismus und journalistischer Arbeit führen (vgl. Lokot und 
Diakopoulos 2016: 15; Carlson 2014: 14). Zudem wird in dieser Gegenüberstellung 
herausgearbeitet, welchen Wert klassischer Journalismus und die Leistung von Jour- 
nalist:innen für Lesende in einer demokratischen Gesellschaft hat. 

Bereits in den Focus Groups differenzieren Lesende sehr deutlich zwischen Ein- 
satzgebieten, in denen sie sich maschinengeschriebene Texte vorstellen können oder 
diese den menschlich verfassten Nachrichten vorziehen. Genauso werden Themen 
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und Darstellungsformen thematisiert, in denen sie keine automatisiert generierten 
Texte konsumieren möchten. Sie formulieren auch, dass sie sich von Journalist:innen 
vor allem Humor, Einordnung, Abwägung und die Bewertung von Sachverhalten 
wünschen. In der Gegenüberstellung von Journalismus und automatisierten Jour- 
nalismus schärfen Lesende also ihre Wünsche und Anforderungen an Journalismus 
und können diese konkret formulieren. 

Die — zugegebenermaßen nicht einfache — Aufgabe für Medienorganisationen 
und die Zivilgesellschaft ist es, ein geeignetes Forum und Methoden zu finden, um 
diesen wichtigen gesellschaftlichen Dialog zu führen und zu begleiten. Und daraus 
eine Schärfung der Wünsche und Anforderungen der Lesenden an journalistische 
Angebote sowie eine Debatte über die Relevanz und den Wert von Journalismus in 
der demokratischen Gesellschaft zu erzielen. 


Journalist:innen: Mediendarstellungen von Robotern und Kls 

Abschließend sei auf den Einfluss hingewiesen, der von Roboter- und KI- 
Darstellungen in den Medien auf die Vertrauensbewertung des automatisierten Jour- 
nalismus ausgeübt wird, aus dem sich auch eine Verantwortung für Journalist:innen 
in der Berichterstattung ergibt. Diese Studie zeigt, dass Mediendarstellungen von 
Robotern und Künstlichen Intelligenzen für Lesende aktuell die Möglichkeit bieten, 
mit fehlendem Wissen über automatisierten Journalismus umzugehen und basierend 
auf diesen Darstellungen Vertrauensentscheidungen getroffen werden. Die Teilneh- 
menden sprechen in den Focus Groups davon, dass sie diese Mediendarstellungen 
mehrheitlich als negativ und bedrohlich wahrnehmen. In Verbindung mit automa- 
tisiertem Journalismus be- und verstärken sie die Angst der Lesenden, durch auto- 
matisierte Kommunikation von Dritten bewusst manipuliert zu werden. 

Dieser Zusammenhang zeigt zum einen erneut, dass Medienorganisationen auto- 
matisiert generierte Nachrichten kennzeichnen und Informationen über tatsächli- 
che Einsätze kommunizieren sollten, um dem Vorwurf der bewussten Manipula- 
tion zu entgehen und Schreckensszenarien wie das der ‚Verdrängung der Jour- 
nalist:innen durch Roboter‘ zu entkräften. Zum anderen wird aber auch die Ver- 
antwortung der einzelnen Journalist:innen in der Berichterstattung über Transfor- 
mationsprozesse deutlich: Journalist:innen müssen technologische Entwicklungen 
kritisch-reflexiv begleiten, damit Lesende informierte Vertrauensentscheidungen 
treffen können. Gleichzeitig sind aber einseitig beschriebene Bedrohungsszena- 
rien durch den Technologieeinsatz oder beängstigend gestaltete Zukunftsszenarien 
wenig hilfreich, wenn Lesende einen Umgang mit automatisierten Nachrichten fin- 
den und Vertrauensentscheidungen vornehmen sollen. An der Notwendigkeit, sich 
als Leser:in mit automatisiertem Journalismus auseinanderzusetzen, besteht hinge- 
gen kein Zweifel — automatisierter Journalismus ist eine Medieninnovation, die in 
den Redaktionen in Deutschland angekommen ist. 
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